炼数成金 商业智能自然语言处理
订阅

自然语言处理

斯坦福大学课程告诉你如何对社交与互联网数据进行情感分析
斯坦福大学课程告诉你如何对社交与互联网数据进行情感分析
情感分析(Sentiment Analysis)1)What is Sentiment Analysis?情感分析(Sentiment analysis),又称倾向性分析,意见抽取(Opinion extraction),意见挖掘(Opinion mining),情感挖掘(Sentiment mining),主 ...
数据挖掘基础:分词入门
数据挖掘基础:分词入门
谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成 ...
“数学之美”系列二十:自然语言处理的教父 马库斯
“数学之美”系列二十:自然语言处理的教父 马库斯
我们在前面的系列中介绍和提到了一些年轻有为的科学家,迈克尔·柯林斯,艾里克·布莱尔,大卫·雅让斯基,拉纳帕提等等,他们都出自宾夕法尼亚计算机系米奇·马库斯(Mitch Marcus)名下。就像许多武侠小说中描写的, ...
“数学之美”系列十八:矩阵运算和文本处理中的分类问题
“数学之美”系列十八:矩阵运算和文本处理中的分类问题
我在大学学习线性代数时,实在想不出它除了告诉我们如何解线性方程外,还能有什么别的用途。关于矩阵的许多概念,比如特征值等等,更是脱离日常生活。后来在数值分析中又学了很多矩阵的近似算法,还是看不到可以应用 ...
“数学之美”系列十五:繁与简 自然语言处理的几位精英
“数学之美”系列十五:繁与简 自然语言处理的几位精英
我在数学之美系列中一直强调的一个好方法就是简单。但是,事实上,自然语言处理中也有一些特例,比如有些学者将一个问题研究到极致,执著追求完善甚至可以说完美的程度。他们的工作对同行有很大的参考价值,因此我们 ...
"数学之美"系列十二:余弦定理和新闻的分类
"数学之美"系列十二:余弦定理和新闻的分类
余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有紧密的联系。具体说,新闻的分类很大程度上依靠余弦定理。Google 的新闻是自动分类和整理的。所谓新闻的分类无非是要把相似的新闻放到一类中。计算机其 ...
严澜:数据挖掘入门——分词
严澜:数据挖掘入门——分词
谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头也在积极布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智 ...
"数学之美"系列4:怎样度量信息?
"数学之美"系列4:怎样度量信息?
信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年,香农提出了“信息熵”(shāng) 的概念,才解决了对信息的量化度 ...
“数学之美”系列三:隐含马尔可夫模型在语言处理中的应用
“数学之美”系列三:隐含马尔可夫模型在语言处理中的应用
自然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系统中的解码问题 -- 一个人根据接收到的信息,去猜测发话人要表达的意思。这其实就象通信中,我们根据接收端收到的信号去分析、理解、还原发送 ...
“数学之美”系列二:谈谈中文分词
“数学之美”系列二:谈谈中文分词
谈谈中文分词 --- 统计语言模型在中文处理中的一个应用 上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀到美国与太空 ...
“数学之美”系列一:统计语言模型
“数学之美”系列一:统计语言模型
前言 也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望利用 Goog ...
你看的维基百科条目可能是程序写的
你看的维基百科条目可能是程序写的
(IvyP/译)你可能会觉得一天之内写出1万篇文章是不太可能的,但对于瑞典达拉那大学(Dalarna University)的斯渥克尔·约翰逊(Sverker Johansson)来说,这并非是一项不可能的任务——他编写的电脑程序Lsjbot总共为 ...
写了个简单的爬人人网的小程序
写了个简单的爬人人网的小程序
无聊写的,请大家多多指教,这里有个编码问题,输出不了中文,周末竟玩了,没功夫研究,谁能帮我解答一下最好了 最终想法是输出我的好友关系网,但是现在只是简单的把所有好友的id姓名和访问人气输出了。。。。有空 ...
r语言实现文本分析实例
r语言实现文本分析实例
#1加载软件包:#1.1数据欲处理包:#Snowball(处理带空格的语句)#rJava(rmmseg4j的支持包)#rmmseg4j(处理中文的分词,把不带空格的分为带空格的。)#1.2文本分析包:#tm#数据处理##library (RODBC)excel_file - od ...
那些不靠谱的星座运程预测
那些不靠谱的星座运程预测
仔细瞧瞧十二星座运程预测里那些似是而非、模糊不清的话语吧,难道你不会偶尔觉得它们其实说得都是一回事吗?一个叫做information is beautiful的网站就将这种怀疑进行到底,搜集并分析预测里的高频词汇,试图用数据 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-11-14 08:32 , Processed in 0.120518 second(s), 16 queries .