炼数成金 商业智能自然语言处理
订阅

自然语言处理

会打电话的 AI 背后:谷歌Duplex技术解析
会打电话的 AI 背后:谷歌Duplex技术解析
长期以来,人类和计算机之间交互的目标都是希望两者之间可以进行自然的对话,就像两个人之间讲话那样。近几年来,计算机理解和生成自然语音的能力出现了革命性的提高,谷歌语音搜索、WaveNet 之类基于深度神经网络的 ...
不懂word2vec,还敢说自己是做NLP?
不懂word2vec,还敢说自己是做NLP?
到目前为止最常用的词表示方法是 One-hot Representation,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值为 1,这个向量就代表了当前的词。每个词都是 ...
使用fasttext进行文档分类
使用fasttext进行文档分类
fasttext原理fasttext提供了一种有效且快速的方式生成词向量以及进行文档分类。fasttext模型输入一个词的序列,输出这个词序列属于不同类别的概率。fasttext模型架构和Word2Vec中的CBOW模型很类似。不同之处在于,fa ...
TF-IDF与余弦相似性的应用(二):找出相似文章
TF-IDF与余弦相似性的应用(二):找出相似文章
有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举 ...
TF-IDF与余弦相似性的应用(一):自动提取关键词
TF-IDF与余弦相似性的应用(一):自动提取关键词
这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖 ...
原创翻译 | 用NLP识别“假新闻”
原创翻译 | 用NLP识别“假新闻”
我们的目标是寻找一种利用自然语言处理(NLP)来识别和分类假文章的方法。我们收集数据,对文本进行预处理,并将文章转换为用于监督和非监督模型的特性。我们从一开始就知道,把一篇文章归类为“假新闻”可能有点灰色 ...
自然语言处理领域公开数据集
自然语言处理领域公开数据集
网上公开的数据集很多,在这里整理了一份关于自然语言处理领域的公开数据集的清单,内容如下。1. Apache Software Foundation Public Mail Archives(公共邮件存档)大小:200GB内容:截至2011年7月11日所有公开可用 ...
大数据分析5万首《全唐诗》,发现了这些秘密
大数据分析5万首《全唐诗》,发现了这些秘密
近些年来,弘扬中华传统文化的现象级综艺节目不断涌现,如《中国汉字听写大会》、《中国成语大会》、《中国谜语大会》、《中国诗词大会》等,其背后的社会成因,在于人们对中国文化中最精致文字的膜拜心理,虽然浸淫 ...
和机器聊天就像一场糟糕的相亲
和机器聊天就像一场糟糕的相亲
一间普通的会议室里的桌子上,放着一个亚马逊的智能家居产品“Echo”(里面住着一名叫做Alexa的虚拟助手)。另一个会议室里,10个亚马逊员工坐成一排,观察着隔壁场景里的一举一动。第三间会议室里,3个人坐在用黑布 ...
基于Freebase的问答研究
基于Freebase的问答研究
在知识问答中,要把一个自然语言的问句映射到知识库 KB 中是很难的,目前的问答系统通常是将 NLP 问句转换成一个 SPARQL 查询语句去检索 KB。如何完成这一转换过程面临着很多问题,比如怎么在 KB 中找到和问句中匹配 ...
2018年聊天机器人状态报告
2018年聊天机器人状态报告
根据Drift、SurveyMonkey Audience、Salesforce和myclever的“2018年聊天机器人状态报告”,聊天机器人预计能够24小时为简单任务提供即时服务,但不是进行复杂查询的最佳渠道。聊天机器人尚未在消费者中找到广泛的吸 ...
微软机器翻译系统:中-英翻译水平可“与人类媲美”
微软机器翻译系统:中-英翻译水平可“与人类媲美”
机器翻译是科研人员攻坚了数十年的研究领域,曾经很多人都认为机器翻译根本不可能达到人类翻译的水平。虽然此次突破意义非凡,但研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终 ...
机器翻译的前世今生
机器翻译的前世今生
机器翻译源于对自然语言的处理。1949 年,洛克菲勒基金会的科学家沃伦·韦弗提出了利用计算机实现不同语言的自动翻译的想法,并且得到了学术界和产业界的广泛支持。韦弗的观点也代表了当时学术界的主流意见,就是以 ...
AI将取代记者?路透社推出AI新闻助手 近期入驻全球新闻编辑室
AI将取代记者?路透社推出AI新闻助手 近期入驻全球新闻编辑室
路透社正致力于构建一款人工智能工具,以帮助新闻记者分析数、提出故事构想、甚至撰写一部分内容。其目的并不是取代记者,而是以电子数据科学家兼文案撰写助理的身份出现,旨在丰富新闻内容。自去年夏季推出以来,这 ...
给AI写台词是怎样一种体验?Siri创意总监现身说法
给AI写台词是怎样一种体验?Siri创意总监现身说法
一句过年好,能换来Siri花样百出的回应。这些有点冷、有点萌,又似乎在抖机灵的回复,都是哪来的?AI自动生成?目前技术还没那么先进。在这些智能助手背后,藏着一个神秘群体:AI的编剧。他们负责给智能助理写台词, ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-7-16 05:07 , Processed in 0.091528 second(s), 16 queries .