1. 介绍
有这么一句话,长文本用CBOW
,短文本用lstm
。CBOW
就是Word2Vec的一种训练方法。
doc2vec和topic model是一个层次的东西。
首先在word2vec之前,做NLP的都是使用BOW或者n-gram。用BOW会损失上下文信息,用n-gram导致数据维度太高和稀疏问题。而doc2vec和word2vec是无监督学习,完全可以当做pre-train。
虽然之前已经看过一遍这本书,但一直没有留下笔记,很多东西又有遗忘,所以记下一下重要的东西。
很早之前学习生物信息时候的笔记。
之前学习React
的一些总结。
我的Ubuntu配置指南。
本文介绍Pandas
基本使用。