2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班)
時間:2019-08-16 09:00 至 2019-08-19 16:30
地點:北京
- 參會報名
- 會議通知
- 會議日程
- 會議嘉賓
- 參會指南
- 邀請函下載
首頁 > 商務會議 > IT互聯(lián)網(wǎng)會議 > 2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班) 更新時間:2019-09-06T09:07:49
2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班) 已過期
|
發(fā)票類型:增值稅專用發(fā)票 增值稅普通發(fā)票 |
領取方式:現(xiàn)場領取 |
發(fā)票內(nèi)容: 會議費 會務費 會議服務費 培訓費 資料費 服務費 |
參會憑證:郵件/短信發(fā)送參會通知 電子票 |
會議通知
會議內(nèi)容 主辦方介紹
2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班)宣傳圖
?“Python爬蟲與文本挖掘核心技術(shù)”培訓班通知
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡信息呈現(xiàn)指數(shù)式增長,要在短時間內(nèi)獲取大量信息,網(wǎng)絡爬蟲無疑是一種最適合的方法。通過爬蟲獲取的海量信息,我們可以對其進行進一步的分析:市場預測、文本分析、機器學習方法等。
Python作為一門腳本語言,它靈活、易用、易學、適用場景多,實現(xiàn)程序快捷便利,早已經(jīng)成為程序員們的一門編程利器。Python這門編程語言包羅萬象,可以說掌握了python,除了一些特殊環(huán)境和高度的性能要求,你可以用它做任何事。為提升相關(guān)科技工作者的技術(shù)水平,北京軟數(shù)信息技術(shù)研究院特舉辦“Python爬蟲與文本挖掘核心技術(shù)”培訓班,本次培訓從爬蟲的基本知識入手,使用Python作為實現(xiàn)工具,一步步地講述網(wǎng)絡爬蟲的實現(xiàn),具體內(nèi)容如下:
【培訓目標】
1、讓學員快速掌握python語言基礎及Python爬蟲項目的編寫,學會獨立開發(fā)常見的爬蟲項目,并能勝任相關(guān)工作;2、解決學員實際工作中的疑難問題。
【時間地點】
2019年08月16日——2019年08月19日 ??北京
(時間安排:第一天報到,授課三天)
【培訓對象】
?各省市、自治區(qū)從事為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等與數(shù)據(jù)分析、挖掘相關(guān)的企事業(yè)單位技術(shù)骨干、科研院所研究人員和大專院校相關(guān)專業(yè)教學人員及在校研究生、碩士、博士等相關(guān)人員。
【頒發(fā)證書】
參加相關(guān)培訓并通過考試的學員可獲得由工業(yè)和信息化部通信和信息技術(shù)創(chuàng)新人才培養(yǎng)工程頒發(fā)《數(shù)據(jù)挖掘應用》職業(yè)水平證書。
北京軟數(shù)信息技術(shù)研究院
2019年07月17日?
查看更多
會議日程 (最終日程以會議現(xiàn)場為準)
python爬蟲與文本挖掘核心技術(shù)課程大綱
第一天:python基礎 ??與爬蟲入門 |
第一章:Python基礎 |
<1.0>初識Python與Anaconda <1.1>變量類型、數(shù)據(jù)結(jié)構(gòu) <1.2>?Python控制流語句 <1.3>?Python函數(shù)與類 |
第二章:Python數(shù)據(jù)分析常用庫 |
<2.0>使用Numpy進行數(shù)值計算 <2.1>使用Matplotlib進行數(shù)據(jù)可視化 <2.2>使用Pandas進行數(shù)據(jù)分析 <2.3>使用Sci-Kit Learn進行模型構(gòu)建 |
|
第三章:Python爬蟲技術(shù)入門 |
<3.0>認識爬蟲與反爬蟲 <3.1>配置環(huán)境變量 <3.2>Python爬蟲的基本流程 <3.3>正則表達式 |
|
案例1:航空公司客戶價值分析 案例2:使用正則表達式提取電話號碼 |
||
第二天:python爬蟲進階 |
第四章:Python爬蟲核心技術(shù) |
<4.0> urllib3, requests模塊實現(xiàn)HTTP請求 <4.1>網(wǎng)頁解析(正則表達式、XPath、BeautifulSoup) <4.2>數(shù)據(jù)存儲 <4.3>模擬登陸(表單登陸、Cookies登陸) <4.4>驗證碼識別 |
第五章:Python爬蟲技術(shù)進階 |
<5.0>安裝Selenium庫及瀏覽器補丁 <5.1>打開瀏覽器對象并訪問網(wǎng)頁 <5.2>頁面等待 <5.3>頁面操作 <5.4>預期條件 <5.5>信息提取 |
|
案例1:前程無憂招聘信息提取 案例2:模擬登陸數(shù)睿思網(wǎng)站 案例3:《流浪地球》豆瓣影評分析? |
||
第第三天:文本分析基礎和進階 ? |
第六章:文本挖掘入門 |
<6.0>文本挖掘概述 <6.1>分詞(jieba庫) <6.2>去除停用詞 <6.3>詞云(WordCloud)繪制 <6.4>文本的向量表示 |
第七章:文本挖掘進階 |
<7.0>文本分類(Text Classifier) <7.1>文本聚類(Text Clustering) <7.2>主題模型(Topic Model) |
|
案例1: 基于文本挖掘的垃圾短信識別 案例2:電商評論主題模型構(gòu)建 |
查看更多
會議嘉賓 (最終出席嘉賓以會議現(xiàn)場為準)
【主講專家】
楊老師:北京軟數(shù)信息技術(shù)研究院特邀講師,具備豐富的培訓經(jīng)驗,曾為多家企業(yè)、院校服務過專業(yè)培訓工作。從事數(shù)據(jù)挖掘工作五年,擅長文本挖掘及深度神經(jīng)網(wǎng)絡RNN,熟悉常用機器學習算法原理及應用,如神經(jīng)網(wǎng)絡、SVM、決策樹、貝葉斯等算法;精通R、Python、Matlab等常用數(shù)據(jù)挖掘處理工具。具有豐富的實踐項目經(jīng)驗。如“京東電商產(chǎn)品評論情感分析”項目;“珠江數(shù)碼大數(shù)據(jù)營銷推薦應用”項目;“電子商務網(wǎng)站智能推薦服務”項目。
查看更多
參會指南
會議門票 場館介紹
【培訓費用】
A類:¥RMB:3900/人(含報名費、培訓費、教材資料費、場地費、午餐費、證書費等)
B類:¥RMB:3500/人(含報名費、培訓費、教材資料費、場地費、午餐費、證書費等)
此費用為學生優(yōu)惠價,需簽到時出示學生證;
食宿可統(tǒng)一安排,費用自理。
頒發(fā)證書:參加相關(guān)培訓并通過考試的學員可獲得由工業(yè)和信息化部通信和信息技術(shù)創(chuàng)新人才培養(yǎng)工程頒發(fā)《數(shù)據(jù)挖掘應用》職業(yè)水平證書。
查看更多
交通指南:
北京市海淀區(qū)學院路30號
北京科技大學(University of Science & Technology Beijing,USTB)是教育部直屬全國重點大學,為國家“211工程”、“985工程優(yōu)勢學科創(chuàng)新平臺”重點建設院校,入選“2011計劃”、“卓越工程師教育培養(yǎng)計劃”、“高等學校學科創(chuàng)新引智計劃(111計劃)“、“國家建設高水平大學公派研究生項目”,設有研究生院,是北京高科大學聯(lián)盟成員 。
學校于1952年由原北洋大學、清華大學等6所國內(nèi)著名大學的礦冶科系組建而成,初名北京鋼鐵工業(yè)學院,1960年更名北京鋼鐵學院,是全國首批成立研究生院的22所高校之一。1988年定名北京科技大學,1997年5月,學校首批進入國家211工程”建設高校行列。2006年,學校成為首批“985工程”優(yōu)勢學科創(chuàng)新平臺建設項目高校。2014年,入選國家“2011計劃”?,F(xiàn)已發(fā)展成為一所以工科為主,工學、理學、管理學、文學、經(jīng)濟學、法學等多學科協(xié)調(diào)發(fā)展的研究型重點大學。
溫馨提示
酒店與住宿:
為防止極端情況下活動延期或取消,建議“異地客戶”與活動家客服確認參會信息后,再安排出行與住宿。
退款規(guī)則:
活動各項資源需提前采購,購票后不支持退款,可以換人參加。
您可能還會關(guān)注
-
2024PM產(chǎn)品力領航者大會
2025-05-16 上海
-
AiCon深圳2025|全球人工智能與大模型應用峰會
2025-08-22 深圳
-
2024中國軟件技術(shù)大會
2024-12-13 北京
-
AI+研發(fā)數(shù)字峰會(AiDD2024)深圳站
2024-11-08 深圳
報名平臺,您可在線購票
會議支持:
-
會員折扣
該會議支持會員折扣
具體折扣標準請參見plus會員頁面 -
會員返積分
每消費1元累積1個會員積分。
僅PC站支持。 -
會員積分抵現(xiàn)
根據(jù)會員等級的不同,每抵用1元可使用的積分也不一樣,具體可參見PLUS會員頁面。 僅PC站支持。
部分參會單位
- 樂元素科技(北京)股份有限公司
- 上海體育學院
郵件提醒通知