炼数成金 商业智能自然语言处理
订阅

自然语言处理

语音合成(TTS)技术的概念、技术边界与未来机会
语音合成(TTS)技术的概念、技术边界与未来机会
TTS(Text-To-Speech,语音合成),目前是一个“小而美”的AI领域,但我个人觉得非常有意思,感觉TTS在未来会被行业真正重视起来,并且会出现做得不错的创业公司。我们比较熟悉的ASR技术(Automatic Speech Recognit ...
EMNLP 2018 最佳论文:Facebook提升11BLEU的无监督机器翻译
EMNLP 2018 最佳论文:Facebook提升11BLEU的无监督机器翻译
说到机器翻译,谷歌吃螃蟹并商用的 NMT、微软研究院媲美人类水平的 AI 翻译系统我们都做过比较多的报道,大家也都比较熟悉;不过它们都是需要监督的。谷歌自然可以使用海量语料训练 NMT,微软研究院的系统即便使用了 ...
白宫版“潜伏”,数据分析锁定副总统
白宫版“潜伏”,数据分析锁定副总统
9月5日,《纽约时报》发表了一封匿名来信《我是特朗普政府中的一名抵抗者》,作者自称特朗普总统身边的高管,对特朗普的执政大肆批评并揭露了不少白宫内幕,称政府内部存在针对特朗普的“抵抗力量”。来信中他表示, ...
NLP 和知识图谱:金融科技领域的“双子星”
NLP 和知识图谱:金融科技领域的“双子星”
金融行业因其与数据的高度相关性,成为人工智能最先应用的行业之一,而NLP与知识图谱作为人工智能技术的重要研究方向与组成部分,正在快速进入金融领域,并日益成为智能金融的基石。一般的Fintech公司只会集中在其中 ...
中文词向量论文综述(一)
中文词向量论文综述(一)
在目前的NLP各项任务中,词向量已经得到了广泛的应用并取得了很好的效果,然而大多数是对于英文等西方语言,对于中文,由于中文汉字包含了巨大的信息,在中文词向量的工作中有很大的提升,这篇论文认为汉字的组件( ...
论文解析 | 罪行预测
论文解析 | 罪行预测
近些年来,Legal Jugement Prediction 任务越来越引起大家的关注,这个任务的目的是通过给定的事实描述,预测出罪名,法条以及刑期等相关信息,charge prediction 任务就是这样的一个任务,这对一些法律助手是很有帮 ...
AI对话系统3.0:社交聊天机器人
AI对话系统3.0:社交聊天机器人
最近,人工智能领域的后起之秀Facebook着实火了一把。根据2017 年6 月17 日美国《大西洋月刊》的报道,Facebook人工智能实验室设计的两个聊天机器人在谈判的训练中,发展出了一种全新的、只有它们自己能够理解的语言 ...
FastText的内部机制
FastText的内部机制
fasttext是一个被用于对词向量和句子分类进行高效学习训练的工具库,采用c++编写,并支持训练过程中的多进程处理。你可以使用这个工具在监督和非监督情况下训练单词和句子的向量表示。这些训练出来的词向量,可以应 ...
利用Lattice LSTM的最优中文命名实体识别方法
利用Lattice LSTM的最优中文命名实体识别方法
作为信息抽取的一项基本任务,命名实体识别(NER)近年来一直受到研究人员的关注。该任务一直被作为序列标注问题来解决,其中实体边界和类别标签被联合预测。英文 NER 目前的最高水准是使用 LSTM-CRF 模型实现的(La ...
分析了3500种中西药品说明书,发现了中药命名的秘密
分析了3500种中西药品说明书,发现了中药命名的秘密
国家药品监督管理局(以下简称药监局)自今年3月组建后,中药问题似乎更受关注。6月19日,药监局发布《中药药源性肝损伤临床评价技术指导原则》。7月13日,药监局曝光42批次药品不合格,其中40个批次为中药饮片或制 ...
如何匹配两段文本的语义?
如何匹配两段文本的语义?
在目前主流的研究方向来看,匹配两段文本的语义主要有两个任务,一个是paraphrase,即判断一段文本是不是另一段文本的释义(即换一种说法,但是意思不变);一个是问答对匹配,或者说检索式QA,即给定一个问题,判断 ...
不得不了解的五种Attention模型方法及其应用
不得不了解的五种Attention模型方法及其应用
先简单谈一谈 attention 模型的引入。以基于 seq2seq 模型的机器翻译为例,如果 decoder 只用 encoder 最后一个时刻输出的 hidden state,可能会有两个问题(我个人的理解)。encoder 最后一个 hidden state,与句子 ...
近期有哪些值得读的QA论文?
近期有哪些值得读的QA论文?
GDAN,Question Generation 和 Question Answering 相结合,利用少量的有标注的 QA 对 + 大量的无标注的 QA 对来训练 QA 模型。回顾下 CMU 11411/611/711 的 final project,项目是阅读理解,分为 Asking System 和 ...
COLING 2018 最佳论文解读:序列标注经典模型复现
COLING 2018 最佳论文解读:序列标注经典模型复现
在词的表示方面,本文摒弃了基于传统的特征的方法,直接使用词本身的信息进行编码。除了词向量以外,为了更好地对那些不常见的词编码,文章使用 LSTM 或者 CNN 对构成词语的字符进行编码。在整个句子级别,文章同样 ...
用递归神经网络,撰写一份特朗普式发言稿!
用递归神经网络,撰写一份特朗普式发言稿!
特朗普充满个人特色的语言风格让作者产生了兴趣,如果把他的推文和演讲稿都用于训练数据,再运用递归神经网络能否生成一份有特式风格的发言稿呢?结论是,如果数据和算力足够大的情况下,总统竞选班子里或许可以有算 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-7-20 02:50 , Processed in 0.184864 second(s), 16 queries .