炼数成金 商业智能自然语言处理
订阅

自然语言处理

文本深度表示模型—word2vec&doc2vec词向量模型
文本深度表示模型—word2vec&doc2vec词向量模型
深度学习掀开了机器学习的新篇章,目前深度学习应用于图像和语音已经产生了突破性的研究进展。深度学习一直被人们推崇为一种类似于人脑结构的人工智能算法,那为什么深度学习在语义分析领域仍然没有实质性的进展呢? ...
让机器理解语言的魔法师——揭秘Facebook语言技术小组
让机器理解语言的魔法师——揭秘Facebook语言技术小组
Facebook 这个社交媒体巨头涉足人工智能很晚,但它有大约 50 人组成的「语言技术组(Language Tech Group)」,他们正计划革新我们使用 Facebook 的方式,并维护它作为世界上最大的社交网络的地位。上个月,在 Faceb ...
ICML等六大会议自然语言处理类论文统计分析:谁是领跑者?
ICML等六大会议自然语言处理类论文统计分析:谁是领跑者?
昨日,作者 Marek 发布文章,统计了自然语言处理领域,各大高校、科技公司在六大论文会议上发表相关论文的数据情况。对行业内各机构此方面的研究状况给出了一个直观的图形展示。最近,我好奇在我的行业里,有多少机 ...
文本深度表示模型—word2vec&doc2vec词向量模型
文本深度表示模型—word2vec&doc2vec词向量模型
深度学习掀开了机器学习的新篇章,目前深度学习应用于图像和语音已经产生了突破性的研究进展。深度学习一直被人们推崇为一种类似于人脑结构的人工智能算法,那为什么深度学习在语义分析领域仍然没有实质性的进展呢? ...
字词的向量表示
字词的向量表示
Word2vec是一种可以进行高效率词嵌套学习的预测模型。其两种变体分别为:连续词袋模型(CBOW)及Skip-Gram模型。从算法角度看,这两种方法非常相似,其区别为CBOW根据源词上下文词汇('the cat sits on the')来预测 ...
Facebook首次将29层深度卷积网络用于自然语言处理
Facebook首次将29层深度卷积网络用于自然语言处理
在许多自然语言处理任务中起到主导地位的方法是循环神经网络(RNN,尤其是长短时间记忆网络,LSTM)和卷积神经网络(ConvNets)。然而,相比于深度卷积网络在计算机视觉领域中取得的巨大成功,这些网络结构还是太过 ...
Bag of Words
Bag of Words
Bag of Words即词袋模型,是对样本数据的一种表示方法,主要应用在 NLP(自然语言处理)和 IR(信息检索)领域,近年也开始在 CV(计算机视觉)发挥作用。该模型在表示样本数据时,可以假设假设:一个文本或文档可以看作 ...
文本分类与SVM
文本分类与SVM
文本分类属于有监督的学习,所以需要整理样本。根据业务需求,确定样本标签与数目,其中样本标签多为整数。在svm中其中如果为二分类,样本标签一般会设定为-1和1,而在朴素贝叶斯方法中,一般为0和1,但不是固定的, ...
典型语料库介绍
典型语料库介绍
20世纪60s,Francis 和Kucera 在布朗(Brown)大学建立,是世界上第一个根据系统性原则采集样本的标准语料库,100万词规模。选自1961年美国人撰写出版的普通语体的文本,15种题材,共500个样本,每个样本不少于2000 ...
Baidu分词算法分析III
Baidu分词算法分析III
百度拼写检查系统整体流程看起来很简单,但是还有一些遗留的小问题,比如是否将词表里面所有同音词都作为用户的提示信息呢?比如某个拼音有10个同音词,是否都输出呢?百度并没有将所有同音词都输出而是选择一定筛选 ...
Baidu分词算法分析II
Baidu分词算法分析II
我们再来看一个例子。提交查询“遥远古古巴比伦”,这个查询被百度切分为《遥远,古古,巴比伦》,说明词典里面有”巴比伦”,但是是否有”古巴比伦”这个词汇不确定,此时看不出是正向切分还是反向切分得出的结果, ...
Baidu分词算法分析I
Baidu分词算法分析I
随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为 普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引 ...
现代汉语词语切分研究
现代汉语词语切分研究
今天的内容选自北京大学计算语言学研究所常宝宝《计算语言学》讲义。本文讲述了中文分词的基本概念,并介绍了最大匹配法分词,今后我们还将会介绍其他分词方法。什么是汉语自动切分?通过计算机把组成汉语文本的字串 ...
从产业角度说说NLP这个行当
从产业角度说说NLP这个行当
前面一篇博文的本意,是想借题发挥,从工业运用的角度说说NLP(NaturalLanguage Processing:自然语言处理)这个行当。不好意思,我算是这个行当在工业界的老古董了(学界不算,学界有的是NLP师爷和大牛)。跟我同期 ...
从Google开源自然语言学习想到的一个阅读英文的方法
从Google开源自然语言学习想到的一个阅读英文的方法
我没有留过学,从来没有接受过任何英文教育,但我之前一直觉得自己的英文处在一个“还行”的状态:我觉得自己不是很怕听和说,尤其是四五年前去了两次美国后,自己的英文会话能力有了一定程度的加深。也有人评价过我 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-7-16 05:09 , Processed in 0.106307 second(s), 16 queries .