炼数成金 商业智能自然语言处理
订阅

自然语言处理

替代键盘输入的大趋势:语音输入法与其背后的技术解析
替代键盘输入的大趋势:语音输入法与其背后的技术解析
我们都知道搜狗的一个核心产品就是输入法,2011年的时候,语音还没有像现在业界这么火,但是他们认为语音输入一定是未来很重要的一种输入方式。所以,搜狗开始布局自己的语音技术,并在一年之内快速把自己的技术做起 ...
谷歌发布 Zero-Shot 神经机器翻译系统:AI 巴别塔有望成真
谷歌发布 Zero-Shot 神经机器翻译系统:AI 巴别塔有望成真
过去10年中,谷歌翻译已从仅支持几种语言发展到了支持 103 种,每天翻译超过了 1400 亿字。为了实现这一点,我们需要构建和维护许多不同的系统,以便在任何两种语言之间进行转换,由此产生了巨大的计算成本。神经网 ...
微软宣布其所有语音翻译服务已全部使用深层神经网络技术
微软宣布其所有语音翻译服务已全部使用深层神经网络技术
除Microsoft Translator语音翻译API已经支持的九种语言——阿拉伯文、中文、英文、法文、德语、意大利语、巴西葡萄牙语、俄语和西班牙语,目前深层神经网络技术还支持日语的文本翻译。这10种语言涵盖了Microsoft Tra ...
更精准流畅!Google 翻译今日正式运用神经机器网络翻译系统
更精准流畅!Google 翻译今日正式运用神经机器网络翻译系统
“好想出国玩,可惜我不会外语。”“不懂的专有名词太多了,我不能胜任这份工作。”“遇到异国的同龄人,好想跟他们交流,可惜语言不通。”语言障碍,不应该成为驻足不前的理由!起初,Google 开拓性地推出了大型统 ...
谷歌神经机器翻译再突破:实现高质量多语言翻译和zero-shot翻译
谷歌神经机器翻译再突破:实现高质量多语言翻译和zero-shot翻译
昨天,谷歌在其官方博客上宣布其在谷歌翻译(Google Translate)上再次取得重大进展。这家搜索巨头表示现在已经将神经机器翻译(neural machine translation)集成到了其网页版和移动版的翻译应用之中,这意味着它可 ...
漫谈词向量
漫谈词向量
非监督式学习得到的词向量(word embedding)已经成功地应用于许多NLP的任务中,它常被誉为是一项利器。实际上,在许多NLP任务中,词向量已经完全地取代了传统的分布特征,比如布朗聚类和LSA特征。去年的ACL和EMNLP ...
亿万词汇构建神经网络,Facebook提出语言模型训练新算法
亿万词汇构建神经网络,Facebook提出语言模型训练新算法
Facebook 人工智能研究(FAIR)设计出一种新式的 softmax 函数逼近,专用于 GPU,帮助其在语言模型的基础上通过巨量词汇来有效训练神经网络。由于在语音识别、机器翻译或语言建模等领域的优异表现,用于序列预测的神 ...
【真假川普】数据科学家用NLP语义分析拆穿愤怒的Trump
【真假川普】数据科学家用NLP语义分析拆穿愤怒的Trump
数据科学家David Robinson分析8月9日Trump的Twitter文本后发现,Trump安卓手机和iPhone发布的tweet差别太大,应该是由不同人发布,Robinson认为,Trump本人使用安卓手机发布带有更多负面情感的消息,iPhone则由选举 ...
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
过去两年来,深度学习已经改写了我们进行机器翻译的方法。对语言翻译一窍不通的深度学习研究者拿出的相对简单的机器学习解决方案正在击败由最好的人类专家打造的语言翻译系统。这种突破背后的技术被称为序列到序列学 ...
微软语音识别实现历史性突破:语音转录达到专业速录员水平
微软语音识别实现历史性突破:语音转录达到专业速录员水平
微软的语音识别有了重大突破,这一技术在对话中的词的识别水平上已经达到了人类水平。今天推送的第二条文章,机器之心对微软首席语音科学家黄学东进行了专访,深入了解微软语音技术背后的「秘密武器」。后排左起:Wa ...
注意力机制(Attention Mechanism)在自然语言处理中的应用
注意力机制(Attention Mechanism)在自然语言处理中的应用
近年来,深度学习的研究越来越深入,在各个领域也都获得了不少突破性的进展。基于注意力(attention)机制的神经网络成为了最近神经网络研究的一个热点,本人最近也学习了一些基于attention机制的神经网络在自然语言 ...
语音识别新里程碑:微软新系统词错率低至6.3%
语音识别新里程碑:微软新系统词错率低至6.3%
在这周二发表的一篇研究论文中,黄学东说:「我们最好的单个系统在 NIST 2000 Switchboard 集上取得了 6.9% 的词错率。我们相信这是取得最好表现的不基于系统结合的单个系统。在 Switchboard 测试数据上,数个声学模 ...
谷歌开源大规模语言建模库,10亿+数据,探索 RNN 极限
谷歌开源大规模语言建模库,10亿+数据,探索 RNN 极限
谷歌今天宣布开源大规模语言建模模型库,这项名为“探索RNN极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 8 ...
计算语言学思想碰撞的浪潮:ACL 2016
计算语言学思想碰撞的浪潮:ACL 2016
在计算机自动解数学题这个任务上,之前的工作都是基于一些小规模而且多样性不足的数学题集,我们认为这样得出来的结论可能不太有代表性。因此我们使用半自动的方法搜集标注了多达1万8千道小学数学题,并在此基础上对 ...
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
使用机器学习进行语言翻译:神经网络和seq2seq为何效果非凡?
我们都知道而且喜欢谷歌翻译(Google Translate),这个网站可以几乎实时地在 100 多种不同的人类语言之间互相翻译,就好像是一种魔法。我们还可以通过手机和智能手表使用谷歌翻译:谷歌翻译背后的技术被称为机器翻 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-11-14 08:05 , Processed in 0.117202 second(s), 16 queries .