第1 章中文分詞研究/1
1.1 研究背景和意義/2
1.2 中文分詞研究現(xiàn)狀/5
1.3 面臨的問題與挑戰(zhàn)/19
第2 章面向微博語料的新詞識別/22
2.1 新詞定義及其分析/23
2.2 新詞識別的統(tǒng)計量/26
2.3 新詞識別算法/33
第3 章面向微博語料的新詞識別方法的作用/43
3.1 新詞識別實驗語料介紹/43
3.2 新詞識別實驗評價方法/44
3.3 普通新詞識別實驗設計及結果分析/45
3.4 低頻新詞識別實驗設計及結果分析/50
3.5 小結/55
第4 章基于λ-主動學習的中文微博分詞方法/57
4.1 候選樣例池的構建/58
4.2 基于半監(jiān)督學習方法的初始分詞器/70
4.3 λ-主動學習方法/72
第5 章基于λ-主動學習分詞方法的作用/79
5.1 λ-主動學習分詞方法實驗語料介紹/79
5.2 評價方法/80
5.3 基于規(guī)則修正的跨領域微博分詞結果/80
5.4 初始分詞器的分詞結果/82
5.5 λ-主動學習擴充的語料對LSTM 分詞器的影響/83
5.6 小結/86
第6 章基于深度神經網絡的中文微博分詞/88
6.1 神經網絡/89
6.2 基于LSTM 神經網絡的中文分詞方法/90
6.3 基于BLSTM 神經網絡的中文分詞方法/93
6.4 基于BLSTM 和CRFs的協(xié)同訓練微博分詞框架/96
第7 章基于深度神經網絡的中文微博分詞的作用/107
7.1 基于深度神經網絡的中文微博分詞實驗數(shù)據介紹/107
7.2 評價方法/107
7.3 λ-主動學習方法對LSTM 分詞器的影響/108
7.4 協(xié)同訓練方法的分詞結果/110
7.5 小結/116
參考文獻/118
索引/139