Part1 - NLP 經典機器學習馬拉松
NLP自然語言機器學習馬拉松是一個結合自學、專家協助及社群討論的AI自學挑戰活動,目標是利用 100 天的時間讓學員掌握自然語言與機器學習/深度學習的關鍵知識點和實務技術應用。(本活動機器學習與深度學
內容簡介
作者介紹
適合人群
你將會學到什麼
購買須知
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)
-
Python NLP 程式基礎
利用Python處理String(字串)資料型態,為日後數據前處理奠定基石
-
詞彙與分詞技術
英文資料不需要,中文資料很重要的斷詞技術與可應用選字系統、與錯字勘正的經典基礎語言模型
-
NLP詞性標註方法
給予字詞詞性特徵,為NLP的任務中提供低層次的語義信息
-
文字預處理與詞向量技術
利用各種不同技術,將文字轉化為可供模型訓練的向量型態
-
NLP與經典機器學習模型
利用經典機器學習模型解決如垃圾郵件與情緒分類等NLP相關任務
-
期末實務專題(一) 自製中文選字系統
自製中文選字系統,利用NLP技術讓機器預測下一個字。
-
期末實務專題(二) 建制新聞分類器
建製新聞分類器,利用NLP技術看標題就可以自動分類別。
-
期末實務專題(三) 文件分類-垃圾郵件
垃圾郵件分類(判斷是否為垃圾郵件)是 NLP 非常有價值的應用,請同學練習從實例中,以ML技巧對這些電郵簡訊做預測。
-
期末實務專題(四) 文件分類-情緒分析
文件分類情緒分析的應用,主要是協助電商自動地將所銷售的產品,將使用者評論依照正向和負向分類,以便做統計分析,提高未來的銷售量和服務品質。
-
期末實務專題(五) 潛在語意分析
我們用SVD將編碼後的多維向量字降至低維,再用matplotlib把前兩維攤在平面上,我們可用放大鏡來檢視各個字在這些文章題目中彼此的距離,達到分類效果。
-
期末實務專題(六)
三連詞(Trigram)是以上下文猜測目標文字的技巧,本習題是Trigram技術用來改寫一篇現成文章,用不同的字卻有相近的意思。
-
期末實務專題(七)
-
期末實務專題(八)