【NLP】粗读 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

粗读 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding[TOC]BERT 可以在一个比较大的数据集上,训练好比较深的神经网络(预训练模型),使其应用在很多 NLP 的任务上面,简化了训练,并提升了性能。标题解释一下 Pre-training,如果在一个大的数据集上训练好一个模型,但该模型

- 阅读全文 -

【NLP】初探

【NLP】初探整理自网络,感谢 OpenBMB,PaperWeekly, MLT Artificial Intelligence。有监督学习文本数据搜集和预处理将文本进行编码和表征从 one-hot 表示一个词到用 bag-of-words 来表示一段文本,从 k-shingles 把一段文本切分成一些文字片段,到汉语中用各种序列标注方法将文本按语义进行分割,从 tf-idf 中用频率的手段来表

- 阅读全文 -