炼数成金 商业智能自然语言处理
订阅

自然语言处理

微软机器翻译系统:中-英翻译水平可“与人类媲美”
微软机器翻译系统:中-英翻译水平可“与人类媲美”
机器翻译是科研人员攻坚了数十年的研究领域,曾经很多人都认为机器翻译根本不可能达到人类翻译的水平。虽然此次突破意义非凡,但研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终 ...
机器翻译的前世今生
机器翻译的前世今生
机器翻译源于对自然语言的处理。1949 年,洛克菲勒基金会的科学家沃伦·韦弗提出了利用计算机实现不同语言的自动翻译的想法,并且得到了学术界和产业界的广泛支持。韦弗的观点也代表了当时学术界的主流意见,就是以 ...
AI将取代记者?路透社推出AI新闻助手 近期入驻全球新闻编辑室
AI将取代记者?路透社推出AI新闻助手 近期入驻全球新闻编辑室
路透社正致力于构建一款人工智能工具,以帮助新闻记者分析数、提出故事构想、甚至撰写一部分内容。其目的并不是取代记者,而是以电子数据科学家兼文案撰写助理的身份出现,旨在丰富新闻内容。自去年夏季推出以来,这 ...
给AI写台词是怎样一种体验?Siri创意总监现身说法
给AI写台词是怎样一种体验?Siri创意总监现身说法
一句过年好,能换来Siri花样百出的回应。这些有点冷、有点萌,又似乎在抖机灵的回复,都是哪来的?AI自动生成?目前技术还没那么先进。在这些智能助手背后,藏着一个神秘群体:AI的编剧。他们负责给智能助理写台词, ...
如何做好文本关键词提取?从三种算法说起
如何做好文本关键词提取?从三种算法说起
在自然语言处理领域,处理海量的文本文件最关键的是要把用户最关心的问题提取出来。而无论是对于长文本还是短文本,往往可以通过几个关键词窥探整个文本的主题思想。与此同时,不管是基于文本的推荐还是基于文本的搜 ...
密码学家百年无法辨认,500年前古怪手稿加密希伯来语被AI算法破译
密码学家百年无法辨认,500年前古怪手稿加密希伯来语被AI算法破译
几个世纪以来,伏尼契手稿(Voynich manuscript)一直是本人类无法理解的书,但现在我们终于可以读懂它了——这要归功于我们在手稿写成的500年后发明的机器智能。伏尼契手稿通常被称为“世界上最神秘的书籍”,它是 ...
用生成对抗网络解决NLP问题:谷歌大脑提出MaskGAN
用生成对抗网络解决NLP问题:谷歌大脑提出MaskGAN
循环神经网络(RNN)(Graves 等人, 2012)是序列型数据以及序列标记任务中最常见的生成模型。循环神经网络在语言模型(Mikolov 等人,2010)、机器翻译(Wu 等人,2016)和文本分类(Miyato 等人,2017)中显示出引人 ...
微软、阿里用阅读理解证明,文字的事儿人类已经不如 AI 了
微软、阿里用阅读理解证明,文字的事儿人类已经不如 AI 了
据CNN、CNET、彭博社等多家外媒报道,1月11日,微软和阿里巴巴开发的AI模型在斯坦福阅读测试中首次胜过人类。这是继国际象棋、桥牌等游戏之后,机器再次战胜人类。SQuAD比赛,是由斯坦福大学发起的机器阅读理解领域 ...
SQuAD文本理解挑战赛十大模型解读
SQuAD文本理解挑战赛十大模型解读
SQuAD 和之前的完形填空类阅读理解数据集如 CNN/DM ,CBT 等最大的区别在于:SQuAD 中的答案不在是单个实体或单词,而可能是一段短语,这使得其答案更难预测。SQuAD 包含公开的训练集和开发集,以及一个隐藏的测试 ...
周明:中国NLP如何跻身世界顶尖水平?
周明:中国NLP如何跻身世界顶尖水平?
我们国内的自然语言处理,跟国家对人工智能的规划基本上是同步的。也就是说,我们到2020年进入到世界先进水平,期待着在2030年达到世界顶尖水平。在NLP领域,我们中国现在是很好的追随者,国际上(主要是美国)一旦 ...
NLP秘笈,从入门到进阶
NLP秘笈,从入门到进阶
熟悉和了解自然语言处理领域的基本术语、任务定义和基本算法,比如输入输出、评价标准和应用场景。为以后的进一步学习、科研、产品开发以及学术和技术交流奠定基础。本书内容涵盖了自然语言处理的方方面面,从底层的 ...
微软沈向洋等人长文:从Eliza到小冰,社交对话机器人的机遇和挑战
微软沈向洋等人长文:从Eliza到小冰,社交对话机器人的机遇和挑战
会话系统经过数十年的研究与开发,从 20 世纪 60 和 70 年代的 Eliza 和 Parry,到 ATIS 项目中的自动任务完成系统,Siri 这样的智能个人助理,再到微软小冰这样的聊天机器人,出现了很多种形式。社交聊天机器人的吸 ...
人工智能的诗与远方,一文读懂NLP起源、流派和技术
人工智能的诗与远方,一文读懂NLP起源、流派和技术
自然语言处理作为人工智能的一个分支,其源头和人工智能一样,都出自于计算机科学的祖师爷级人物——阿兰 · 图灵。图灵在提出图灵测试的时候,就把使用自然语言与人进行对话可以乱真的能力作为判别一个机器系统有无 ...
Facebook 开源语音识别工具包wav2letter
Facebook 开源语音识别工具包wav2letter
wav2letter 是 Facebook AI 研究院今天开源的简单高效的端到端自动语音识别(ASR)系统。该实现的原作者包括 Ronan Collobert、Christian Puhrsch、Gabriel Synnaeve、Neil Zeghidour 和 Vitaliy Liptchinsky。wav2l ...
GitHub新开放项目FoolNLTK:一个便捷的中文处理工具包
GitHub新开放项目FoolNLTK:一个便捷的中文处理工具包
在中文信息处理中,分词(word segmentation)是一项基本技术,因为中文的词汇是彼此相连的,不像英文有一个天然的空格符可以分隔不同的单词。虽然把一串汉字划分成一个个词对于汉语使用者来说是很简单的事情,但对 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-11-14 09:20 , Processed in 0.609304 second(s), 16 queries .