課程介紹:
Python是數(shù)據(jù)分析最常用的語言之一,中文自然語言處理(簡(jiǎn)稱NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。NLP是一門融語言學(xué)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、大數(shù)據(jù)以及人工智能等于一體的科學(xué)。本課程偏重實(shí)戰(zhàn),不僅系統(tǒng)介紹了NLP涉及的知識(shí)點(diǎn),同時(shí)也教會(huì)大家如何實(shí)際應(yīng)用與開發(fā)。
本次培訓(xùn)主要介紹NLP所需要了解的Python科學(xué)包、正則表達(dá)式以及檢索技術(shù)的知識(shí)。包括NLP相關(guān)的各個(gè)知識(shí)點(diǎn):詞法分析技術(shù)、句法分析技術(shù)、常用的向量化方法,介紹機(jī)器學(xué)習(xí)的一些基本概念,重點(diǎn)突出NLP常用的分類算法、聚類算法,同時(shí)還分享了幾個(gè)案例。每個(gè)部分都有對(duì)應(yīng)源數(shù)據(jù)和完整代碼,供實(shí)戰(zhàn)使用。
自然語言處理(NLP)屬于人工智能與計(jì)算機(jī)語言學(xué)的交叉領(lǐng)域,處理的是計(jì)算機(jī)與人類語言之間的交互問題。隨著人機(jī)交互需求的日益增長(zhǎng),計(jì)算機(jī)具備處理當(dāng)前主要自然語言的能力已經(jīng)成為了一個(gè)必然趨勢(shì)。
本培訓(xùn)適合通信、金融、保險(xiǎn)、制造、醫(yī)藥、教育科研、市場(chǎng)調(diào)研、連鎖零售和電子商務(wù)等行業(yè)的數(shù)據(jù)分析人員,通過本課程的學(xué)習(xí),將對(duì)NLP與數(shù)據(jù)科學(xué)領(lǐng)域中的概念有一個(gè)充分的了解,并能將這些知識(shí)應(yīng)用到日常工作中。
課程模塊
課程主題1.NLP歷史現(xiàn)在及為什么需要學(xué)習(xí)NLP技術(shù)
2.NLP實(shí)現(xiàn)機(jī)器學(xué)習(xí),聊天機(jī)器人,情感分析和語義搜索
模塊二NLP與PYTHON編程3.Python環(huán)境搭建及開發(fā)工具安裝
4.NLP常用PYTHON開發(fā)包的介紹
5.Jieba安裝、介紹及使用
6.StanfordNLP在Python環(huán)境中安裝、介紹及使用
7.Hanlp在Python環(huán)境中安裝、介紹及使用
模塊三快速掌握NLP技術(shù)之分詞、詞性標(biāo)注和關(guān)鍵字提取
08.分詞、詞性標(biāo)注及命名實(shí)體識(shí)別介紹及應(yīng)用
09.準(zhǔn)確分詞之加載自定義字典分詞
10.準(zhǔn)確分詞之動(dòng)態(tài)調(diào)整詞頻和字典
11.詞性標(biāo)注代碼實(shí)現(xiàn)及信息提取
12.人名、地名、機(jī)構(gòu)名等關(guān)鍵命名實(shí)體識(shí)別
13.TextRank算法原理介紹
14.基于TextRank關(guān)鍵詞提取
模塊四句法與文法16.依存句法與語義依存分析
17.依存句法樹解析(子樹遍歷,遞歸搜索,葉子節(jié)點(diǎn)提取等)
18.名詞短語塊挖掘
19.自定義語法與CFG
模塊五20.N-GRAM算法介紹
21.N-GRAM生成詞語對(duì)
22.TF-IDF算法介紹應(yīng)用
23.基于TF-IDF挖掘符合語言規(guī)范的N-GRAM
模塊六表示學(xué)習(xí)與關(guān)系嵌入
24.語言模型
25.詞向量
26.深入理解Word2vec算法層次sofmax
27.深入理解Word2vec算法負(fù)采樣
28.6.4基于Word2vec技術(shù)的詞向量、字向量訓(xùn)練
模塊七深度學(xué)習(xí)之卷積神經(jīng)網(wǎng)絡(luò)
29.BP神經(jīng)網(wǎng)絡(luò)
30.徹底理解深度學(xué)習(xí)指卷積神經(jīng)網(wǎng)絡(luò)
31.CNN文本分類
32.CNN文本分類算法模塊
33.CNN文本分類模型詳解數(shù)據(jù)預(yù)處理
34.CNN文本分類模型測(cè)試與部署
模塊八深度學(xué)習(xí)之遞歸神經(jīng)網(wǎng)絡(luò)35.遞歸網(wǎng)絡(luò)
36.LSTM
37.LSTM文本分類原理
38.LSTM文本分類代碼架構(gòu)
39.LSTM文本分類代碼詳解
40.LSTM文本分類模型預(yù)測(cè)與部署
模塊九特定領(lǐng)域命名實(shí)體識(shí)別NER技術(shù)
41.基于深度學(xué)習(xí)醫(yī)藥保險(xiǎn)命名實(shí)體識(shí)別課題背景介紹
42.醫(yī)藥保險(xiǎn)命名實(shí)體和實(shí)體關(guān)系體系建立和命名實(shí)體分類規(guī)范
43.醫(yī)藥保險(xiǎn)命名實(shí)體識(shí)別相關(guān)前沿技術(shù)和難點(diǎn)
44.基于深度學(xué)習(xí)醫(yī)藥保險(xiǎn)命名實(shí)體識(shí)別的算法模塊設(shè)計(jì)
45.數(shù)據(jù)的采集,清洗,數(shù)據(jù)機(jī)器自動(dòng)標(biāo)注及轉(zhuǎn)化為深度學(xué)習(xí)格式
46.模型本地Lib庫封裝
47.部署tensorflow訓(xùn)練好的模型為云服務(wù)
48.算法設(shè)計(jì)及代碼實(shí)現(xiàn)
49.代碼調(diào)試,參數(shù)優(yōu)化及深度剖析(深入理解)
1.系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開發(fā)人員。