炼数成金 商业智能自然语言处理
订阅

自然语言处理

谷歌神经机器翻译再突破:实现高质量多语言翻译和zero-shot翻译
谷歌神经机器翻译再突破:实现高质量多语言翻译和zero-shot翻译
昨天,谷歌在其官方博客上宣布其在谷歌翻译(Google Translate)上再次取得重大进展。这家搜索巨头表示现在已经将神经机器翻译(neural machine translation)集成到了其网页版和移动版的翻译应用之中,这意味着它可 ...
漫谈词向量
漫谈词向量
非监督式学习得到的词向量(word embedding)已经成功地应用于许多NLP的任务中,它常被誉为是一项利器。实际上,在许多NLP任务中,词向量已经完全地取代了传统的分布特征,比如布朗聚类和LSA特征。去年的ACL和EMNLP ...
亿万词汇构建神经网络,Facebook提出语言模型训练新算法
亿万词汇构建神经网络,Facebook提出语言模型训练新算法
Facebook 人工智能研究(FAIR)设计出一种新式的 softmax 函数逼近,专用于 GPU,帮助其在语言模型的基础上通过巨量词汇来有效训练神经网络。由于在语音识别、机器翻译或语言建模等领域的优异表现,用于序列预测的神 ...
【真假川普】数据科学家用NLP语义分析拆穿愤怒的Trump
【真假川普】数据科学家用NLP语义分析拆穿愤怒的Trump
数据科学家David Robinson分析8月9日Trump的Twitter文本后发现,Trump安卓手机和iPhone发布的tweet差别太大,应该是由不同人发布,Robinson认为,Trump本人使用安卓手机发布带有更多负面情感的消息,iPhone则由选举 ...
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
过去两年来,深度学习已经改写了我们进行机器翻译的方法。对语言翻译一窍不通的深度学习研究者拿出的相对简单的机器学习解决方案正在击败由最好的人类专家打造的语言翻译系统。这种突破背后的技术被称为序列到序列学 ...
微软语音识别实现历史性突破:语音转录达到专业速录员水平
微软语音识别实现历史性突破:语音转录达到专业速录员水平
微软的语音识别有了重大突破,这一技术在对话中的词的识别水平上已经达到了人类水平。今天推送的第二条文章,机器之心对微软首席语音科学家黄学东进行了专访,深入了解微软语音技术背后的「秘密武器」。后排左起:Wa ...
注意力机制(Attention Mechanism)在自然语言处理中的应用
注意力机制(Attention Mechanism)在自然语言处理中的应用
近年来,深度学习的研究越来越深入,在各个领域也都获得了不少突破性的进展。基于注意力(attention)机制的神经网络成为了最近神经网络研究的一个热点,本人最近也学习了一些基于attention机制的神经网络在自然语言 ...
语音识别新里程碑:微软新系统词错率低至6.3%
语音识别新里程碑:微软新系统词错率低至6.3%
在这周二发表的一篇研究论文中,黄学东说:「我们最好的单个系统在 NIST 2000 Switchboard 集上取得了 6.9% 的词错率。我们相信这是取得最好表现的不基于系统结合的单个系统。在 Switchboard 测试数据上,数个声学模 ...
谷歌开源大规模语言建模库,10亿+数据,探索 RNN 极限
谷歌开源大规模语言建模库,10亿+数据,探索 RNN 极限
谷歌今天宣布开源大规模语言建模模型库,这项名为“探索RNN极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 8 ...
计算语言学思想碰撞的浪潮:ACL 2016
计算语言学思想碰撞的浪潮:ACL 2016
在计算机自动解数学题这个任务上,之前的工作都是基于一些小规模而且多样性不足的数学题集,我们认为这样得出来的结论可能不太有代表性。因此我们使用半自动的方法搜集标注了多达1万8千道小学数学题,并在此基础上对 ...
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
我们都知道而且喜欢谷歌翻译(Google Translate),这个网站可以几乎实时地在 100 多种不同的人类语言之间互相翻译,就好像是一种魔法。我们还可以通过手机和智能手表使用谷歌翻译:谷歌翻译背后的技术被称为机器翻 ...
Facebook 开源文本分类工具,不用深度学习也可以又快又准
Facebook 开源文本分类工具,不用深度学习也可以又快又准
对于人工智能研究者来说,让机器理解人类所说的话或者在键盘上敲出的字,目前仍然最大技术难题之一。但这又是一个基本要素,是自动文本处理是每天与计算机进行交互的一个关键,从网页搜索到内容排名,再到垃圾邮件过 ...
运用深度学习教机器人理解自然语言
运用深度学习教机器人理解自然语言
在深度学习出现之前,文字所包含的意思是通过人为设计的符号和结构传达给计算机的。本文讨论了深度学习如何用向量来表示语义,如何更灵活地表示向量,如何用向量编码的语义去完成翻译,以及有待改进的地方。在深度学 ...
Google发布了能理解人类语言的云服务
Google发布了能理解人类语言的云服务
上周三,Google智能云开发工具加入了一种云端自然语言API。这项服务可以帮助开发者的应用理解人类语言。这对Google来说是重要的一步。现在共有云的领域中,提供商的平台对人工智能的支持是一个火热的竞争点。有了自 ...
使用SimHash进行海量文本去重
使用SimHash进行海量文本去重
传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法产生的两个签名,如果原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-7-16 05:10 , Processed in 0.115359 second(s), 16 queries .