炼数成金 商业智能自然语言处理
订阅

自然语言处理

一步步理解BERT
一步步理解BERT
NLP:自然语言处理(NLP)是信息时代最重要的技术之一。理解复杂的语言也是人工智能的重要组成部分。而自google在2018年10月底公布BERT在11项nlp任务中的卓越表后,BERT(Bidirectional Encoder Representation from ...
HFL技术分享 #16 | 基于流的生成模型
HFL技术分享 #16 | 基于流的生成模型
生成模型(Generative Model)与判别模型(Discriminative Model)是机器学习模型里的两大家族。判别模型常常用来做回归、分类的任务;而生成模型是一个数据模拟器,可以做数据采样与生成相关的任务。例如,时下非常 ...
HFL技术分享 #15 | 短文本分类及相关技术
HFL技术分享 #15 | 短文本分类及相关技术
文本分类作为文本理解的基本任务、能够服务于大量应用(如文本摘要、情感分析、推荐系统等等),更是长期以来学术界与工业界关注的焦点。 先前的方式主要采取人设定特征(词袋、词性标注、树核等)或者ML/DNN对文本 ...
HFL技术分享#14 | Reinforcement Learning Applications for NLP
HFL技术分享#14 | Reinforcement Learning Applications for NLP
强化学习(RL)是机器学习的一个分支,是介于监督学习和非监督学习之间的,从经验中学习的方法。由于强化学习在机器控制、游戏等领域获得了瞩目的研究成果,学者们开始尝试将RL与自然语言处理相结合,希望解决传统方 ...
HFL技术分享 #13 | 自动文摘相关技术简介
HFL技术分享 #13 | 自动文摘相关技术简介
随着互联网的飞速发展以及数据呈现爆炸式的增长,人们迫切需要一种技术能够从大量、嘈杂的数据中提取关键信息,这种“大量、嘈杂”的数据不仅包含文本,同时也可以是图像、视频、语音等各种模态的数据,自动摘要(Au ...
HFL技术分享 #12 | 对象级情感分析经典模型介绍
HFL技术分享 #12 | 对象级情感分析经典模型介绍
情感分析(Sentiment analysis),又称观点挖掘(Opinion mining),是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。情感分析对于快速掌握大众情绪的走向、预测热点事件等有重要的作用,并与我们的 ...
AI 改写《权力的游戏》结局,和编剧比谁更烂?
AI 改写《权力的游戏》结局,和编剧比谁更烂?
在现有的 AI 语言模型中,GPT-2 是一种达到了 SOTA 效果的文本生成模型。他能生成类似人类语言的连贯性语句,并且可以长期关注某个主题。 相比于其他语言模型,GPT-2 两个较大改进在于:大量数据:研究人员抓取了 80 ...
HFL技术分享 #11 | 知识图谱技术简介
HFL技术分享 #11 | 知识图谱技术简介
近年来,随着深度学习技术的蓬勃发展,自然语言处理(NLP)的研究越来越深入,应用越来越广泛。在NLP技术的广泛应用实践中,人们再次认识到知识在NLP中的重要作用。本文对知识图谱的发展历史和现状做了一个简单的调 ...
HFL技术分享 #10 | 选择型阅读理解技术简介及进展
HFL技术分享 #10 | 选择型阅读理解技术简介及进展
阅读理解任务是根据对文本的理解来回答与文本相关的问题。阅读理解任务不论对人还是对机器都是一个比较难的问题,不同的人与人之间的阅读理解水平也存在较大的差异。因此如何让机器具有阅读理解能力,或者说如何能够 ...
HFL技术分享 #9 | 不平衡数据下的机器学习(下)
HFL技术分享 #9 | 不平衡数据下的机器学习(下)
数据不平衡为机器学习任务带来了诸多挑战,针对这一问题,业界已经做了诸多研究,方向包括数据不平衡导致机器学习模型性能下降的原因、评估方法和解决方案等。针对数据不平衡问题的研究专题可以统称为不平衡学习(Im ...
HFL技术分享 #9 | 不平衡数据下的机器学习(上)
HFL技术分享 #9 | 不平衡数据下的机器学习(上)
数据不平衡是机器学习任务中的一个常见问题。真实世界中的分类任务中,各个类别的样本数量往往不是完全平衡的,某一或某些类别的样本数量远少于其他类别的情况经常发生,我们称这些样本数量较少的类别为少数类,与之 ...
HFL技术分享 #8 | 语言模型简介
HFL技术分享 #8 | 语言模型简介
统计语言模型(Statistical Language Model)是自然语言处理的基础,它是一种具有一定上下文相关特性的数学模型,本质上也是概率图模型的一种,并且广泛应用于机器翻译、语音识别、拼音输入、图像文字识别、拼写纠错、 ...
HFL技术分享 #6 | 基于深度学习的关系抽取
HFL技术分享 #6 | 基于深度学习的关系抽取
信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息,主要任务有实体抽取、关系抽取、事件抽取。其中,关系抽取(Relation Extraction,RE)研究的主要内容是从文本内容中挖掘出实体与实体之间的语 ...
NLP中的词向量对比
NLP中的词向量对比
文本是由每个单词构成的,而谈起词向量,one-hot是可认为是最为简单的词向量,但存在维度灾难和语义鸿沟等问题;通过构建共现矩阵并利用SVD求解构建词向量,则计算复杂度高;而早期词向量的研究通常来源于语言模型, ...
HFL技术分享 #5 | 强化学习基础(下)
HFL技术分享 #5 | 强化学习基础(下)
我们知道,对于使用而言,我们需要将公式以及思路转换成计算机所能够处理的形式,比如迭代形式。在这里我们就需要借鉴贝尔曼方程的思想,对强化学习的相关公式进行推导,使得它可以变换为计算机可处理的迭代形式。我 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-9-18 04:46 , Processed in 0.110956 second(s), 16 queries .