注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡計算機科學理論與基礎知識輿情計算方法與技術

輿情計算方法與技術

輿情計算方法與技術

定 價:¥88.00

作 者: 饒元
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 計算機?網(wǎng)絡 計算機理論

ISBN: 9787121296260 出版時間: 2016-08-01 包裝:
開本: 16開 頁數(shù): 356 字數(shù):  

內容簡介

  社會計算是近十年來快速發(fā)展起來的一個新興的研究領域,它一方面依托于近年社交網(wǎng)絡技術以及應用的快速發(fā)展,使得越來越多的網(wǎng)絡用戶之間產(chǎn)生自聯(lián)接、自媒體、自選擇的內容傳播新方式,并且?guī)砹岁P于針對文本內容深入挖掘與分析的強大動力基礎;另一方面?zhèn)鹘y(tǒng)社會學對于社會活動領域中的分析方法,特別是基于網(wǎng)絡化的社會化分析方法,使得人們發(fā)現(xiàn)在龐大的網(wǎng)絡數(shù)據(jù)中,可以充分地利用其中的一些指標與算法進行有效的度量與分析,從而使得社會網(wǎng)絡分析方法從技術角度上再次獲得了新的生命力。在這兩股力量的共同作用與影響下,社會計算領域中大量的研究成果也在不斷涌現(xiàn)出來。因此,本書從社會計算和自然語言處理與文本挖掘兩個角度出發(fā),針對社會輿情分析過程中存在的核心方法進行綜合介紹。

作者簡介

  CCF 會員; ACM會員 。負責或主持過國家863RFID重大專項“基于RFID的信息集成管理技術研究與開發(fā)”(2006AA04A118); 北京市科委重大專項以及海淀區(qū)科技項目與博士后科研基金項目等多項;國家科技部火炬計劃項目(高技術成果轉化協(xié)同創(chuàng)新平臺與示范)國家社科基金重大項目(“基于多學科理解的社會網(wǎng)絡分析模型研究”第5子課題:虛擬Web網(wǎng)絡空間中的社會網(wǎng) 絡模型與個體行為機制研究)陜西省科技攻關項目: 基于專家知識地圖的科技協(xié)同創(chuàng)新平臺關鍵技術研究與應用(2012K11-18)、基于網(wǎng)絡化感知計算的智慧社區(qū)管理關鍵技術與應用(2013K06-20);2013年,陜西省社科重點項目“中小企業(yè)首席工程師交流互動平臺”機制研究;2012年,西安市技術轉移促進工程項目:社會網(wǎng)絡環(huán)境下的跨學科知識協(xié)同創(chuàng)新關鍵技術研究(CX12178(3))榆林市科技局“產(chǎn)學研”合作項目(科技資源統(tǒng)籌協(xié)同平臺建設)等10余項。

圖書目錄

第 1章社會計算與社會輿情分析概述 1
1.1 社會計算的概念與關鍵技術 1
1.1.1 Web2.0與社會化軟件的特征 1
1.1.2 社會計算的概念 3
1.1.3 社會計算與社會智能研究的核心內容 6
1.2 社會輿情的特征與分析方法 10
1.2.1 社會輿情的概念與特征 10
1.2.2 網(wǎng)絡輿情的形成和演化過程 11
1.2.3 網(wǎng)絡輿情的關鍵技術與方法 13
1.3 本書的知識結構  15
參考文獻  17
實驗室相關工作文獻  17
第 2章社會網(wǎng)絡分析理論與相關技術基礎 18
2.1 社會網(wǎng)絡分析方法  18
2.1.1 社會網(wǎng)絡分析方法的發(fā)展與研究的問題域 18
2.1.2 社會網(wǎng)絡分析方法的主要理論與概念體系 24
2.1.3 社會網(wǎng)絡分析的主要研究方法與分析工具 28
2.2 自然語言處理  31
2.2.1 自然語言處理的基本問題 31
2.2.2 中文分詞 32
2.2.3 命名實體識別 33
2.2.4 共指消解 34
2.2.5 實體關系的抽取 34
2.2.6 事件探測與追蹤 35
2.3 數(shù)據(jù)挖掘與機器學習方法概述 35
2.3.1 數(shù)據(jù)挖掘與機器學習方法 35
2.3.2 基于 Web的文本挖掘 39
2.4 本章小結  41
參考文獻  42
第 3章中文文本特征與詞分析技術 43
3.1 中文文本的基本特征  43
3.1.1 中文文本的基本特征 43
3.1.2 中文文本分析的任務與數(shù)據(jù)結構特征 45
3.1.3 中文文本句法結構分析 50
3.1.4 基于統(tǒng)計的句法分析方法 54
3.2 中文分詞技術  55
3.2.1 中文分詞的核心問題 55
3.2.2 基于規(guī)則的中文分詞的關鍵技術與算法 58
3.2.3 基于統(tǒng)計的中文分詞的關鍵技術與算法 60
3.2.4 基于理解的分詞方法 65
3.2.5 主要中文分詞工具 65
3.3 主題詞庫的構建  67
3.3.1 主題詞基本概念 67
3.3.2 主題詞間的關系定義 69
3.3.3 主題詞的抽取方法 71
3.3.4 主題詞庫的構建 73
3.4 本章小結  79
參考文獻  80
實驗室相關工作  80
第 4章社會網(wǎng)絡環(huán)境下的文本數(shù)據(jù)預處理技術 81
4.1 文本數(shù)據(jù)的詞義沖突與數(shù)據(jù)消歧 81
4.1.1 文本數(shù)據(jù)存在的詞義沖突與消歧 81
4.1.2 基于知識的詞義消歧方法 83
4.1.3 無監(jiān)督的詞義消歧技術 86
4.1.4 有監(jiān)督的詞義消歧技術 89
4.2 文本數(shù)據(jù)的稀疏性與降維 90
4.2.1 數(shù)據(jù)稀疏問題及解決 91
4.2.2 數(shù)據(jù)平滑技術 92
4.2.3 數(shù)據(jù)降維方法 93
4.3 數(shù)據(jù)融合  97
4.3.1 數(shù)據(jù)融合的概念與方法 98
4.3.2 實體的識別與統(tǒng)一表示 99
4.3.3 數(shù)據(jù)沖突處理 102
4.3.4 數(shù)據(jù)關聯(lián) 103
4.4 本章小結 104
參考文獻 104
實驗室相關工作 106
第 5章文本聚類方法分析 107
5.1 聚類基礎概念 107
5.1.1 聚類算法的定義 107
5.1.2 聚類算法的目標與基本數(shù)據(jù)結構 108
5.1.3 數(shù)據(jù)對象距離及相似度度量 109
5.1.4 其他數(shù)據(jù)類型與相似度度量 111
5.2 常用的文本聚類算法 113
5.2.1 文本聚類的基本需求 113
5.2.2 文本聚類方法 114
5.2.3 文本聚類結果的評價方法 120
5.3 基于文本數(shù)據(jù)流的聚類方法121
5.3.1 數(shù)據(jù)流問題的背景 121
5.3.2 數(shù)據(jù)流基本概念與模型 122
5.3.3 數(shù)據(jù)流聚類方法 124
5.3.4 演化分析技術 129
5.4 本章小結 131
參考文獻 131
實驗室相關工作 133
第 6章文本分類方法134
6.1 分類基礎概念 134
6.1.1 分類問題的定義 134
6.1.2 文本分類與目標 135
6.1.3 分類算法的評價 136
6.2 基于概率的貝葉斯分類方法137
6.2.1 貝葉斯概率公式 138
6.2.2 樸素貝葉斯分類原理 138
6.2.3 基于樸素貝葉斯分類算法的文本分類器設計 139
6.2.4 貝葉斯網(wǎng)絡模型 141
6.3 基于核的分類算法 143
6.3.1 支持向量機算法 143
6.3.2 核函數(shù)的定義 145
6.3.3 多類問題的求解算法 147
6.4 其他分類器的常用構造算法149
6.4.1 Rocchio分類算法  149
6.4.2 KNN算法  149
6.4.3 Boosting算法  151
6.5 本章小結 152
參考文獻 153
第 7章信息抽取與摘要自動生成技術 154
7.1 命名實體的識別與抽取技術154
7.1.1 命名實體識別的基本任務 154
7.1.2 人名實體抽取 156
7.1.3 地名實體抽取方法 160
7.1.4 機構名實體抽取方法 163
7.2 網(wǎng)絡文本數(shù)據(jù)中的實體間關系的抽取165
7.2.1 實體關系的定義與基本分類 165
7.2.2 存在關系的實體對抽取方法 166
7.2.3 基于核函數(shù)的實體關系抽取方法 168
7.3 話題識別與追蹤技術(TDT)171
7.3.1 話題識別與追蹤需要解決的問題與目標 171
7.3.2 話題識別與追蹤的經(jīng)典方法 173
7.3.3 話題識別與追蹤的評價方法 175
7.4 自動摘要生成技術 176
7.4.1 自動文檔摘要生成所需要解決的問題與目標 176
7.4.2 單文檔自動摘要生成技術 178
7.4.3 多文檔自動文摘生成的關鍵技術 181
7.4.4 自動摘要系統(tǒng)的評價標準 183
7.5 本章小結 185
參考文獻 185
第 8章社會網(wǎng)絡中社區(qū)識別與信息傳播188
8.1 網(wǎng)絡社區(qū)的識別 188
8.1.1 網(wǎng)絡社區(qū)的概念 189
8.1.2 網(wǎng)絡社區(qū)的特征與關鍵問題 191
8.1.3 基于非重疊社區(qū)的發(fā)現(xiàn)算法 195
8.1.4 基于重疊的網(wǎng)絡社區(qū)發(fā)現(xiàn)與識別算法 198
8.1.5 社區(qū)發(fā)現(xiàn)算法評價方法 201
8.2 網(wǎng)絡信息的傳播模型 203
8.2.1 網(wǎng)絡信息傳播中的基本問題 203
8.2.2 行動者影響力分析 204
8.2.3 信息傳播動力學模型 207
8.3 鏈接預測模型與方法 211
8.3.1 鏈接預測的概念與主要目標 212
8.3.2 鏈接預測存在的主要算法分類與指標 212
8.3.3 鏈接預測存在的經(jīng)典算法 215
8.4 本章小結 218
參考文獻 218
第 9章社會網(wǎng)絡下的情感分析221
9.1 情感計算的基本概念與問題挑戰(zhàn)221
9.1.1 情感分析的概念與研究目標 221
9.1.2 情感詞的識別與標注 223
9.1.3 情感詞典的構建 225
9.2 文本的主/客觀分析與觀點挖掘分析方法228
9.2.1 文本的主/客觀分析方法 228
9.2.2 觀點挖掘分析方法 229
9.3 情感分析與計算方法 232
9.3.1 基于詞的經(jīng)典情感計算與分析方法 232
9.3.2 不同粒度下的情感分析方法 234
9.3.3 文檔主體對象的情感傾向分析方法 240
9.3.4 跨領域文檔的情感傾向分析方法 245
9.3.5 情感計算評價方法 245
9.4 本章小結 246
參考文獻 247
第 10章數(shù)據(jù)可視化技術250
10.1 可視化技術概述 250
10.1.1 可視化技術的基本概念與目標 250
10.1.2 可視化技術的分類 252
10.2 社會網(wǎng)絡可視化的靜態(tài)分析方法260
10.2.1 社會網(wǎng)絡環(huán)境下的可視化方法介紹 260
10.2.2 力導引布局(Force-directed Layout)相關算法  262
10.2.3 層次布局(Tier-based Layout) 264
10.2.4 樹形布局(Tree-based Layout) 269
10.3 動態(tài)可視化交互方法與可視化模式挖掘技術273
10.3.1 可視化的動態(tài)交互與形變技術 274
10.3.2 可視化模式挖掘與分析方法 277
10.4 數(shù)據(jù)可視化的質量評價方法278
10.4.1 數(shù)據(jù)可視化的質量評價模型 278
10.4.2 數(shù)據(jù)可視化的質量評價指標 280
10.5 本章小結 281
參考文獻 282
第 11章社會計算與輿情分析應用284
11.1  社會網(wǎng)絡輿情分析與應用284
11.1.1  分析指標體系與分析模型的建立 284
11.1.2  分析平臺的建立與應用 288
11.2  企業(yè)社會網(wǎng)絡分析與應用289
11.2.1  企業(yè)社會網(wǎng)絡構造方法 290
11.2.2  企業(yè)特征的抽取 291
11.2.3  企業(yè)社會網(wǎng)絡服務平臺與可視化分析 292
11.3  專家網(wǎng)絡與知識圖譜應用293
11.3.1  專家模型的構建與屬性抽取規(guī)則 293
11.3.2  專家模型中的屬性消歧與網(wǎng)絡構建 297
11.4  專利地圖的應用298
11.4.1  專利地圖的研究與制作方法 298
11.4.2  專利地圖的構建與分析 299
11.5  金融風險預測與分析應用302
11.6  本章小結304
參考文獻 305
第 12章社會計算與輿情分析的技術發(fā)展趨勢307
12.1 大數(shù)據(jù)與數(shù)據(jù)世系 308
12.2 基于機器學習的類人腦科學的演化310
12.3 社會計算向社會智能的演化312
12.4 小結 314
參考文獻 315
附錄 A基于信息傳播的分類及網(wǎng)站示例 317
附錄 B 基于 LDA模型的候選主題詞抽取算法描述318
附錄 C常用的中文停用詞表321
附錄 D TBDC4TS聚類算法偽代碼示意333
后記335

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) leeflamesbasketballcamps.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號