炼数成金 商业智能自然语言处理
订阅

自然语言处理

HFL技术分享 #5 | 强化学习基础(上)
HFL技术分享 #5 | 强化学习基础(上)
强化学习是机器学习的一大分支,介于监督学习与无监督学习之间。与其他机器学习相比,有一些明显的特点,是一种序列决策过程。强化学习应用范围很广,比如西洋双陆战棋的胜利、直升飞机上的特技表演、金融中证券投资 ...
HFL技术分享 #4 | 基于深度学习的文本分类技术
HFL技术分享 #4 | 基于深度学习的文本分类技术
文本分类任务是自然语言处理(NLP)领域最基础和传统的任务之一,该任务又会根据领域类型的不同分成很多子任务,例如情感分类、主题分类和问题分类等。很多机器学习的新方法都会先尝试在文本分类任务上进行实验验证 ...
HFL技术分享 #3 | 神经机器翻译
HFL技术分享 #3 | 神经机器翻译
机器翻译是自然语言处理领域最经典,最重要的任务之一,不仅具有重要的科学研究价值,同时又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的 ...
HFL技术分享 #2 | 生成对抗网络GAN简介
HFL技术分享 #2 | 生成对抗网络GAN简介
如果把人工智能划分为计算智能、感知智能和认知智能的三个阶段,那我们目前应该处于立足于感知智能,并且正在向认知智能逐步探索的阶段。我们目前在语音识别、图像识别等领域已经取得了实质性的突破,机器也基本达到 ...
HFL技术分享 #1 | 事件抽取概述
HFL技术分享 #1 | 事件抽取概述
随着互联网信息爆炸式的增长,从非结构化的信息中提取出有用的结构化信息显得越来越重要,信息抽取(Information Extraction)任务便应运而生。信息抽取任务的本质是从无结构的自然文本中识别出事件描述(包括:实体 ...
BERT时代与后时代的NLP
BERT时代与后时代的NLP
2018年是NLP的收获大年,模型预训练技术终于被批量成功应用于多项NLP任务。之前搞NLP的人一直羡慕搞CV的人,在ImageNet上训练好的模型,居然拿到各种任务里用都非常有效。现在情形有点逆转了。搞CV的人开始羡慕搞NLP ...
结巴中文分词原理分析3
结巴中文分词原理分析3
分词都是调用jieba.cut 这个函数,cut函数即是分词的入口,这个函数在文件jieba/__init__.py。其中参数sentence是需要分词的句子样本;cut_all是分词的模式,精确模式,全模式,默认使用HMM模型。
结巴中文分词原理分析2
结巴中文分词原理分析2
基于字符串匹配分词,机械分词算法。将待分的字符串与一个充分大的机器词典中的词条进行匹配。分为正向匹配和逆向匹配;最大长度匹配和最小长度匹配;单纯分词和分词与标注过程相结合的一体化方法。所以常用的有:正 ...
结巴中文分词原理分析1
结巴中文分词原理分析1
jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型。jieba.cut_for_search 方法接受两个参数:需要分词的字符串;是否使用 HMM 模型。该 ...
基于小样本学习的意图识别冷启动
基于小样本学习的意图识别冷启动
随着深度学习和自然语言处理技术的发展,很多公司都在致力于发展人机对话系统,希望人和机器之间能够通过自然语言进行交互。笔者所在的阿里巴巴小蜜北京团队打造了一个智能对话开发平台——Dialog Studio,以赋能第 ...
NLP最新科研福利!MSRA开源学术界最全面语义分析数据集
NLP最新科研福利!MSRA开源学术界最全面语义分析数据集
微软亚洲研究院(MSRA),刚刚送出最新一批AI资源和福利。在“中国高校人工智能人才国际培养计划”2019国际人工智能专家论坛暨2019微软新一代人工智能开放科研教育平台合作论坛,MSRA面向高校提供最新的人工智能技术 ...
Bert时代的创新:Bert应用模式比较及其它
Bert时代的创新:Bert应用模式比较及其它
我们知道,ELMO/GPT/Bert这几个自然语言预训练模型给NLP带来了方向性的指引,一般在应用这些预训练模型的时候,采取两阶段策略:首先是利用通用语言模型任务,采用自监督学习方法,选择某个具体的特征抽取器来学习 ...
谷歌提出新型自动语音识别数据增强大法,直接对频谱图“动刀”,提升模型表现
谷歌提出新型自动语音识别数据增强大法,直接对频谱图“动刀”,提升模型表现
每次用语音输入完成“打字”过程,你的手机就经历了一次自动语音识别(ASR)。这种已经无处不在的音频转录成文本的技术,在缺乏足够大的数据集,模型过拟合严重。因此当前如何去扩增音频数据是个大问题。谷歌大脑在 ...
一起来看看词性标注
一起来看看词性标注
词性指以词的特点作为划分词类的根据。词类是一个语言学术语,是一种语言中词的语法分类,是以语法特征(包括句法功能和形态变化)为主要依据、兼顾词汇意义对词进行划分的结果。从组合和聚合关系来说,一个词类是指 ...
自然语言处理精品资料
自然语言处理精品资料
2018 年自然语言处理 (Natural Language Processing, NLP) 发展飞速,今年 OpenAI 的 GPT 2 编故事的能力已经让他们都不敢开源代码了,去年 BERT 也是打破多项纪录,再往前的 GPT 1, ELMO 和 Transformer 也都是 NLP ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-9-18 04:37 , Processed in 0.081593 second(s), 16 queries .