一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

PyQuery 庫(kù)學(xué)習(xí)筆記(文末有免費(fèi)好看的數(shù)據(jù)分析直播課推薦)

 aloha52o 2017-09-23

蔣蜀黍,Python愛(ài)好者社區(qū)專(zhuān)欄作者

博客地址:https://ask./blog/JiangYiXin

1、初始化

1.1、字符串初始化

frompyquery importPyQuery aspy

html = '''

   

       
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''

    doc = py(html)
    print(doc('li'))

    1.2、URL初始化

    frompyquery importPyQuery aspy

    # 通過(guò)URL來(lái)獲取
    doc = py(url='http://www.baidu.com')
    #
    print(type(doc('title')))
    # 輸出選中的head標(biāo)簽
    print(doc('head'))

    1.3、文件的初始化

    frompyquery importPyQuery aspy

    # 通過(guò)文件來(lái)獲取
    doc = py(filename='demo1.html')
    #
    print(type(doc('li')))
    # 輸出所有的li標(biāo)簽
    print(doc('li'))

    2、基本的CSS選擇器

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''

    doc = py(html)
    # 選中idcontainer中的classlist中的li標(biāo)簽
    print(doc('#container .list li'))

    3、查找元素

    3.1、子元素

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    # 獲取classlist的元素
    items = doc('.list')
    #
    print(type(items))
    print(items)
    # 在先前找到的元素中獲取li標(biāo)簽
    lis = items.find('li')
    #
    print(type(lis))
    print(lis)
    # 獲取先前找到的元素中的所有子元素
    lis2 = items.children()
    print(type(lis2))
    print(lis2)
    # 獲取先前找到的元素中的class為active的元素
    li3 = items.children('.active')
    print(li3)

    3.2、父元素

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    # 獲取classlist的元素
    items = doc('.list')
    # 獲取所選元素的父元素
    container = items.parent()
    print(type(container))
    print(container)
    print('==========================')
    # 獲取所選元素的所有父元素
    parents = items.parents()
    print(type(parents))
    print(parents)
    print('==========================')
    # 獲取所選元素的所有父元素中classcontainer的元素
    parent = items.parents('.container')
    print(parent)

    3.3、兄弟元素

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    # 獲取classlist的元素
    items = doc('.list')
    li = doc('.list .item-0.active')
    # 查找選中元素的所有兄弟元素(不包含自己)
    print(li.siblings())
    # 查找選中元素的所有兄弟元素中classactive的元素(不包含自己)
    print(li.siblings('.active'))



    4、遍歷

    4.1、單個(gè)元素

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)

    # 選中單個(gè)單個(gè)元素
    li = doc('.item-0.active')
    print(li)

    4.2、多個(gè)元素

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)

    # 查找所有li標(biāo)簽
    lis = doc('li').items()
    #
    print(type(lis))
    forli inlis:
       print(li)



    5、獲取信息

    5.1、獲取屬性

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    a = doc('.item-0.active a')
    # third item
    print(a)
    # link3.html    獲取選中標(biāo)簽的href屬性
    print(a.attr('href'))
    # link3.html
    print(a.attr.href)

    5.2、獲取文本

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    a = doc('.item-0.active a')
    # third item
    print(a)
    # 獲取a標(biāo)簽的內(nèi)容
    print(a.text())

    5.3、獲取HTML

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    li = doc('.item-1.active')
    #
  • fourth item

  • print(li)
    # 獲取li標(biāo)簽的HTML
    print(li.html())



    6、DOM操作

    6.1、addClass、removeClass

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    li = doc('.item-0.active')
    print(li)
    # 移除class
    li.removeClass('active')
    print(li)
    # 添加class
    li.addClass('active')
    print(li)

    6.2、attr、css

    frompyquery importPyQuery aspy

    html = '''

       

           
  • first item

  •        
  • second item

  •        
  • third item

  •        
  • fourth item

  •        
  • fifth item

  •    

    '''
    doc = py(html)
    li = doc('.item-0.active')
    print(li)
    # 添加name屬性
    li.attr('name', 'link')
    print(li)
    # 添加css樣式
    li.css('font-size', '14px')
    print(li)

    6.3、remove

    frompyquery importPyQuery aspy

    html = '''

       Hello, World
       

    This is a paragraph.



    '''
    doc = py(html)
    wrap = doc('.wrap')
    print(wrap.text())
    # 在選擇的元素中找到p標(biāo)簽并移除
    wrap.find('p').remove()
    print(wrap.text())

    6.4、其他DOM方法

    http://pyquery./en/latest/api.html



    7、偽類(lèi)選擇器

    frompyquery importPyQuery aspy

    html = '''

       

           

               
  • first item

  •            
  • second item

  •            
  • third item

  •            
  • fourth item

  •            
  • fifth item

  •        
       

    '''

    doc = py(html)
    # 找到第一個(gè)li
    li = doc('li:first-child')
    print(li)
    # 找到最后一個(gè)li
    li = doc('li:last-child')
    print(li)
    # 找到第二個(gè)li
    li = doc('li:nth-child(2)')
    print(li)
    # 找到第三個(gè)到最后的li
    li = doc('li:gt(2)')
    print(li)
    # 找到第偶數(shù)個(gè)li
    li = doc('li:nth-child(2n)')
    print(li)
    # 找到內(nèi)容包含secondli
    li = doc('li:contains(second)')
    print(li)

    更多的選擇器 

    http://www.w3school.com.cn/css/index.asp



    8、官方文檔

    http://pyquery./


    關(guān)注公眾號(hào),“Python愛(ài)好者社區(qū)”,回復(fù)“爬蟲(chóng)”即可獲取爬蟲(chóng)免費(fèi)學(xué)習(xí)視頻。


    Python愛(ài)好者社區(qū)


    為大家提供與Python相關(guān)的最新技術(shù)和資訊。


      本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
      轉(zhuǎn)藏 分享 獻(xiàn)花(0

      0條評(píng)論

      發(fā)表

      請(qǐng)遵守用戶(hù) 評(píng)論公約

      類(lèi)似文章 更多

      色综合久久中文综合网| 日韩欧美高清国内精品| 日韩人妻一区二区欧美| 日韩精品综合免费视频| 成人午夜激情在线免费观看| 性欧美唯美尤物另类视频| 日本高清不卡在线一区| 国产原创激情一区二区三区| 男女午夜福利院在线观看| 国产精品一区二区三区激情| 91亚洲人人在字幕国产| 黄色日韩欧美在线观看| 五月激情婷婷丁香六月网| 欧美日韩国产综合在线| 亚洲少妇一区二区三区懂色| 欧美大黄片在线免费观看| 欧美日韩在线视频一区| 亚洲一区二区三区av高清| 美女被后入福利在线观看| 中文字幕乱码免费人妻av| 国产精品一区二区视频大全| 一区二区三区亚洲天堂| 欧美黑人精品一区二区在线| 在线免费看国产精品黄片| 亚洲欧美天堂精品在线| 亚洲国产av一二三区| 欧美亚洲三级视频在线观看| 亚洲熟女国产熟女二区三区| 激情图日韩精品中文字幕| 中文字幕日韩欧美理伦片| 日韩av欧美中文字幕| 精品一区二区三区不卡少妇av| 最近日韩在线免费黄片| 亚洲欧美视频欧美视频| 91免费精品国自产拍偷拍| 亚洲综合香蕉在线视频| 儿媳妇的诱惑中文字幕| 亚洲一区二区久久观看| 亚洲一区二区亚洲日本| 99一级特黄色性生活片| 亚洲综合精品天堂夜夜|