炼数成金 商业智能自然语言处理
订阅

自然语言处理

如何做好文本关键词提取?从三种算法说起
如何做好文本关键词提取?从三种算法说起
在自然语言处理领域,处理海量的文本文件最关键的是要把用户最关心的问题提取出来。而无论是对于长文本还是短文本,往往可以通过几个关键词窥探整个文本的主题思想。与此同时,不管是基于文本的推荐还是基于文本的搜 ...
密码学家百年无法辨认,500年前古怪手稿加密希伯来语被AI算法破译
密码学家百年无法辨认,500年前古怪手稿加密希伯来语被AI算法破译
几个世纪以来,伏尼契手稿(Voynich manuscript)一直是本人类无法理解的书,但现在我们终于可以读懂它了——这要归功于我们在手稿写成的500年后发明的机器智能。伏尼契手稿通常被称为“世界上最神秘的书籍”,它是 ...
用生成对抗网络解决NLP问题:谷歌大脑提出MaskGAN
用生成对抗网络解决NLP问题:谷歌大脑提出MaskGAN
循环神经网络(RNN)(Graves 等人, 2012)是序列型数据以及序列标记任务中最常见的生成模型。循环神经网络在语言模型(Mikolov 等人,2010)、机器翻译(Wu 等人,2016)和文本分类(Miyato 等人,2017)中显示出引人 ...
微软、阿里用阅读理解证明,文字的事儿人类已经不如 AI 了
微软、阿里用阅读理解证明,文字的事儿人类已经不如 AI 了
据CNN、CNET、彭博社等多家外媒报道,1月11日,微软和阿里巴巴开发的AI模型在斯坦福阅读测试中首次胜过人类。这是继国际象棋、桥牌等游戏之后,机器再次战胜人类。SQuAD比赛,是由斯坦福大学发起的机器阅读理解领域 ...
SQuAD文本理解挑战赛十大模型解读
SQuAD文本理解挑战赛十大模型解读
SQuAD 和之前的完形填空类阅读理解数据集如 CNN/DM ,CBT 等最大的区别在于:SQuAD 中的答案不在是单个实体或单词,而可能是一段短语,这使得其答案更难预测。SQuAD 包含公开的训练集和开发集,以及一个隐藏的测试 ...
周明:中国NLP如何跻身世界顶尖水平?
周明:中国NLP如何跻身世界顶尖水平?
我们国内的自然语言处理,跟国家对人工智能的规划基本上是同步的。也就是说,我们到2020年进入到世界先进水平,期待着在2030年达到世界顶尖水平。在NLP领域,我们中国现在是很好的追随者,国际上(主要是美国)一旦 ...
NLP秘笈,从入门到进阶
NLP秘笈,从入门到进阶
熟悉和了解自然语言处理领域的基本术语、任务定义和基本算法,比如输入输出、评价标准和应用场景。为以后的进一步学习、科研、产品开发以及学术和技术交流奠定基础。本书内容涵盖了自然语言处理的方方面面,从底层的 ...
微软沈向洋等人长文:从Eliza到小冰,社交对话机器人的机遇和挑战
微软沈向洋等人长文:从Eliza到小冰,社交对话机器人的机遇和挑战
会话系统经过数十年的研究与开发,从 20 世纪 60 和 70 年代的 Eliza 和 Parry,到 ATIS 项目中的自动任务完成系统,Siri 这样的智能个人助理,再到微软小冰这样的聊天机器人,出现了很多种形式。社交聊天机器人的吸 ...
人工智能的诗与远方,一文读懂NLP起源、流派和技术
人工智能的诗与远方,一文读懂NLP起源、流派和技术
自然语言处理作为人工智能的一个分支,其源头和人工智能一样,都出自于计算机科学的祖师爷级人物——阿兰 · 图灵。图灵在提出图灵测试的时候,就把使用自然语言与人进行对话可以乱真的能力作为判别一个机器系统有无 ...
Facebook 开源语音识别工具包wav2letter
Facebook 开源语音识别工具包wav2letter
wav2letter 是 Facebook AI 研究院今天开源的简单高效的端到端自动语音识别(ASR)系统。该实现的原作者包括 Ronan Collobert、Christian Puhrsch、Gabriel Synnaeve、Neil Zeghidour 和 Vitaliy Liptchinsky。wav2l ...
GitHub新开放项目FoolNLTK:一个便捷的中文处理工具包
GitHub新开放项目FoolNLTK:一个便捷的中文处理工具包
在中文信息处理中,分词(word segmentation)是一项基本技术,因为中文的词汇是彼此相连的,不像英文有一个天然的空格符可以分隔不同的单词。虽然把一串汉字划分成一个个词对于汉语使用者来说是很简单的事情,但对 ...
百度AAAI 2018录用论文:基于注意力机制的多通道机器翻译模型
百度AAAI 2018录用论文:基于注意力机制的多通道机器翻译模型
目前,很多研究工作者提出了许多基于注意力的神经翻译系统(NMT,Neural Machine Translation)的改进方法,其中效果最优的是基于注意力架构的编解码系统。图 1. 提供了基于注意力 NMT 模型的结构原理,共包括三个部 ...
四个自然语言处理(NLP)业务应用程序
四个自然语言处理(NLP)业务应用程序
自然语言处理算法教导计算机像人一样使用语言。如果你手动搜索来自一组文档的信息,你也可以像搜索引擎一样查看关键字。这就是为什么机器翻译是自然语言处理的第一种形式,它是以二战中的破译技术为蓝本。开发人员希 ...
Bot:带来对话式体验的下一代UI
Bot:带来对话式体验的下一代UI
Bot 有许多类别,它们彼此各不相同,可以从许多维度上进行划分。就面向的服务对象而言,有B2B机器人和B2C机器人,有为多人服务的群聊机器人和提供一对一服务的个人机器人;有面向业务的机器人,也有面向消费的机器人 ...
一文概述2017年深度学习NLP重大进展与趋势
一文概述2017年深度学习NLP重大进展与趋势
近年来,深度学习(DL)架构和算法在图像识别、语音处理等领域实现了很大的进展。而深度学习在自然语言处理方面的表现最初并没有那么起眼,不过现在我们可以看到深度学习对 NLP 的贡献,在很多常见的 NLP 任务中取得 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-7-16 05:09 , Processed in 0.105816 second(s), 16 queries .