• 參會報名
  • 會議通知
  • 會議日程
  • 會議嘉賓
  • 參會指南
  • 邀請函下載

首頁 > 商務會議 > IT互聯(lián)網(wǎng)會議 > 2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班) 更新時間:2019-09-06T09:07:49

2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班)
收藏人
分享到

2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班) 已過期

會議時間:2019-08-16 09:00至 2019-08-19 16:30結(jié)束

會議地點: 北京  北京科技大學  北京市海淀區(qū)學院路30號

會議規(guī)模:50人

主辦單位: 北京軟數(shù)信息技術(shù)研究院

發(fā)票類型:增值稅專用發(fā)票 增值稅普通發(fā)票
領取方式:現(xiàn)場領取 
發(fā)票內(nèi)容: 會議費 會務費 會議服務費 培訓費 資料費 服務費 
參會憑證:郵件/短信發(fā)送參會通知 電子票

行業(yè)熱銷熱門關(guān)注看了又看 換一換

        會議通知

        會議內(nèi)容 主辦方介紹


        2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班)

        2019Python爬蟲與文本挖掘核心技術(shù)培訓班(8月北京班)宣傳圖

        ?“Python爬蟲與文本挖掘核心技術(shù)”培訓班通知

        隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡信息呈現(xiàn)指數(shù)式增長,要在短時間內(nèi)獲取大量信息,網(wǎng)絡爬蟲無疑是一種最適合的方法。通過爬蟲獲取的海量信息,我們可以對其進行進一步的分析:市場預測、文本分析、機器學習方法等。

        Python作為一門腳本語言,它靈活、易用、易學、適用場景多,實現(xiàn)程序快捷便利,早已經(jīng)成為程序員們的一門編程利器。Python這門編程語言包羅萬象,可以說掌握了python,除了一些特殊環(huán)境和高度的性能要求,你可以用它做任何事。為提升相關(guān)科技工作者的技術(shù)水平,北京軟數(shù)信息技術(shù)研究院特舉辦“Python爬蟲與文本挖掘核心技術(shù)”培訓班,本次培訓從爬蟲的基本知識入手,使用Python作為實現(xiàn)工具,一步步地講述網(wǎng)絡爬蟲的實現(xiàn),具體內(nèi)容如下:

        【培訓目標】

        1、讓學員快速掌握python語言基礎及Python爬蟲項目的編寫,學會獨立開發(fā)常見的爬蟲項目,并能勝任相關(guān)工作;2、解決學員實際工作中的疑難問題。

        【時間地點】

        2019年08月16日——2019年08月19日 ??北京

        (時間安排:第一天報到,授課三天)

        【培訓對象】

        ?各省市、自治區(qū)從事為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等與數(shù)據(jù)分析、挖掘相關(guān)的企事業(yè)單位技術(shù)骨干、科研院所研究人員和大專院校相關(guān)專業(yè)教學人員及在校研究生、碩士、博士等相關(guān)人員。

        【頒發(fā)證書】

        參加相關(guān)培訓并通過考試的學員可獲得由工業(yè)和信息化部通信和信息技術(shù)創(chuàng)新人才培養(yǎng)工程頒發(fā)《數(shù)據(jù)挖掘應用》職業(yè)水平證書。


        北京軟數(shù)信息技術(shù)研究院

        2019年07月17日?

        查看更多

        會議日程

        (最終日程以會議現(xiàn)場為準)


        python爬蟲與文本挖掘核心技術(shù)課程大綱

        第一天:python基礎 ??與爬蟲入門

        第一章:Python基礎

        <1.0>初識Python與Anaconda

        <1.1>變量類型、數(shù)據(jù)結(jié)構(gòu)

        <1.2>?Python控制流語句

        <1.3>?Python函數(shù)與類

        第二章:Python數(shù)據(jù)分析常用庫

        <2.0>使用Numpy進行數(shù)值計算

        <2.1>使用Matplotlib進行數(shù)據(jù)可視化

        <2.2>使用Pandas進行數(shù)據(jù)分析

        <2.3>使用Sci-Kit Learn進行模型構(gòu)建

        第三章:Python爬蟲技術(shù)入門

        <3.0>認識爬蟲與反爬蟲

        <3.1>配置環(huán)境變量

        <3.2>Python爬蟲的基本流程

        <3.3>正則表達式

        案例1:航空公司客戶價值分析

        案例2:使用正則表達式提取電話號碼

        第二天:python爬蟲進階

        第四章:Python爬蟲核心技術(shù)

        <4.0> urllib3, requests模塊實現(xiàn)HTTP請求

        <4.1>網(wǎng)頁解析(正則表達式、XPath、BeautifulSoup)

        <4.2>數(shù)據(jù)存儲

        <4.3>模擬登陸(表單登陸、Cookies登陸)

        <4.4>驗證碼識別

        第五章:Python爬蟲技術(shù)進階

        <5.0>安裝Selenium庫及瀏覽器補丁

        <5.1>打開瀏覽器對象并訪問網(wǎng)頁

        <5.2>頁面等待

        <5.3>頁面操作

        <5.4>預期條件

        <5.5>信息提取

        案例1:前程無憂招聘信息提取

        案例2:模擬登陸數(shù)睿思網(wǎng)站

        案例3:《流浪地球》豆瓣影評分析?

        第第三天:文本分析基礎和進階

        ?

        第六章:文本挖掘入門

        <6.0>文本挖掘概述

        <6.1>分詞(jieba庫)

        <6.2>去除停用詞

        <6.3>詞云(WordCloud)繪制

        <6.4>文本的向量表示

        第七章:文本挖掘進階

        <7.0>文本分類(Text Classifier)

        <7.1>文本聚類(Text Clustering)

        <7.2>主題模型(Topic Model)

        案例1: 基于文本挖掘的垃圾短信識別

        案例2:電商評論主題模型構(gòu)建

        查看更多

        會議嘉賓

        (最終出席嘉賓以會議現(xiàn)場為準)


        【主講專家】

        楊老師:北京軟數(shù)信息技術(shù)研究院特邀講師,具備豐富的培訓經(jīng)驗,曾為多家企業(yè)、院校服務過專業(yè)培訓工作。從事數(shù)據(jù)挖掘工作五年,擅長文本挖掘及深度神經(jīng)網(wǎng)絡RNN,熟悉常用機器學習算法原理及應用,如神經(jīng)網(wǎng)絡、SVM、決策樹、貝葉斯等算法;精通R、Python、Matlab等常用數(shù)據(jù)挖掘處理工具。具有豐富的實踐項目經(jīng)驗。如“京東電商產(chǎn)品評論情感分析”項目;“珠江數(shù)碼大數(shù)據(jù)營銷推薦應用”項目;“電子商務網(wǎng)站智能推薦服務”項目。

        查看更多

        參會指南

        會議門票 場館介紹


        【培訓費用】

        A類:¥RMB:3900/人(含報名費、培訓費、教材資料費、場地費、午餐費、證書費等)

        B類:¥RMB:3500/人(含報名費、培訓費、教材資料費、場地費、午餐費、證書費等)

        此費用為學生優(yōu)惠價,需簽到時出示學生證;

        食宿可統(tǒng)一安排,費用自理。

        頒發(fā)證書:參加相關(guān)培訓并通過考試的學員可獲得由工業(yè)和信息化部通信和信息技術(shù)創(chuàng)新人才培養(yǎng)工程頒發(fā)《數(shù)據(jù)挖掘應用》職業(yè)水平證書。

        查看更多

        北京科技大學 北京科技大學

        交通指南:

        北京市海淀區(qū)學院路30號

        北京科技大學(University of Science & Technology Beijing,USTB)是教育部直屬全國重點大學,為國家“211工程”、“985工程優(yōu)勢學科創(chuàng)新平臺”重點建設院校,入選“2011計劃”、“卓越工程師教育培養(yǎng)計劃”、“高等學校學科創(chuàng)新引智計劃(111計劃)“、“國家建設高水平大學公派研究生項目”,設有研究生院,是北京高科大學聯(lián)盟成員 。

        學校于1952年由原北洋大學、清華大學等6所國內(nèi)著名大學的礦冶科系組建而成,初名北京鋼鐵工業(yè)學院,1960年更名北京鋼鐵學院,是全國首批成立研究生院的22所高校之一。1988年定名北京科技大學,1997年5月,學校首批進入國家211工程”建設高校行列。2006年,學校成為首批“985工程”優(yōu)勢學科創(chuàng)新平臺建設項目高校。2014年,入選國家“2011計劃”?,F(xiàn)已發(fā)展成為一所以工科為主,工學、理學、管理學、文學、經(jīng)濟學、法學等多學科協(xié)調(diào)發(fā)展的研究型重點大學。


        溫馨提示
        酒店與住宿: 為防止極端情況下活動延期或取消,建議“異地客戶”與活動家客服確認參會信息后,再安排出行與住宿。
        退款規(guī)則: 活動各項資源需提前采購,購票后不支持退款,可以換人參加。

        活動家為本會議官方合作
        報名平臺,您可在線購票

        會議支持:

        • 會員折扣
          該會議支持會員折扣
          具體折扣標準請參見plus會員頁面
        • 會員返積分
          每消費1元累積1個會員積分。
          僅PC站支持。
        • 會員積分抵現(xiàn)
          根據(jù)會員等級的不同,每抵用1元可使用的積分也不一樣,具體可參見PLUS會員頁面。 僅PC站支持。

        部分參會單位

        • 樂元素科技(北京)股份有限公司
        • 上海體育學院

        郵件提醒通知

        分享到微信 ×

        打開微信,點擊底部的“發(fā)現(xiàn)”,
        使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

        錄入信息

        請錄入信息,方便生成邀請函