一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

python庫camelot安裝及使用中的一些注意事項

 閑讀古書 2021-01-19

1)camelot方法有兩種解析模式:流解析(stream)、格子解析(lattice),其中格子解析能夠保留表格完整的樣式,對于復雜表格來說要優(yōu)于流解析模式。同時,camelot方法默認格子解析(lattice),而采用這種解析方式,需要安裝ghostscript。因此,僅通過pip命令安裝的camelot,代碼運行時通常會報錯。需要下載ghostscript.exe并安裝。安裝后,經測試,并不需要在代碼中import ghostscript。

2)camelot輸出格式如果選擇csv格式,可能存在中文亂碼問題,需要用文本編輯器將導出的csv文件編碼改為ansi格式。
如果想直接保存為excel格式,需要xlwt模塊支持,pip安裝xlwt后tables.export('文件名.xls',f = 'excel')即可輸出為excel格式。

3)后來在另外一臺電腦上安裝camelot庫時出現(xiàn)了一個奇葩的問題,程序運行報錯。反復檢查才發(fā)現(xiàn)原因。首先是在這臺電腦上,我是按照印象輸入pip install camelot,也安裝成功。但代碼運行錯誤。經查閱,正確命令(或者說版本)是pip install camelot-py[cv]。

所以我先uninstall前面安裝的camelot,又重新按照正確的命令安裝camelot-py[cv],但代碼運行時又提示import xlwt有問題,在python庫中檢查了下,xlwt文件是正常的,找了半天沒找到原因。后來單獨卸載xlwt,然后重新pip安裝xlwt,發(fā)現(xiàn)xlwt的版本號由0.7變?yōu)?.3,然后一切就正常了。估計是之前錯誤安裝了camelot的版本,導致順帶安裝的xlwt版本過低,無法兼容python3.6.5。

4)camelot開始時一切正常,但處理一個pdf文件時突然報錯:pdfminer.psparser.SyntaxError: Invalid dictionary construct: [/'Type', /'Font', /'Subtype', /'Type0', /'BaseFont', /b"b'", /"ABCDEE+\\xcb\\xce\\xcc\\xe5'", /'Encoding', /'Identity-H', /'DescendantFonts', <PDFObjRef:11>, /'ToUnicode', <PDFObjRef:19>]

經百度,找到解決方案,修改了pandas和PyPDF2模塊的三處源碼,恢復正常。具體修改內容見python爬蟲處理在線預覽的pdf文檔

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    亚洲国产天堂av成人在线播放| 亚洲伊人久久精品国产| 大香蕉大香蕉手机在线视频| 欧美一区二区日韩一区二区| 国产成人av在线免播放观看av| 久久机热频这里只精品| 久久综合亚洲精品蜜桃| 国产白丝粉嫩av在线免费观看| 欧美精品女同一区二区| 成人三级视频在线观看不卡| 黄色片国产一区二区三区| 精品少妇人妻av免费看| 毛片在线观看免费日韩| 国产午夜精品在线免费看| 欧美一区二区三区性视频| 人妻乱近亲奸中文字幕| 欧美午夜一级艳片免费看| 婷婷色香五月综合激激情| 狠狠干狠狠操在线播放| 千仞雪下面好爽好紧好湿全文| 区一区二区三中文字幕| 国产一区二区三区丝袜不卡| 亚洲欧美日韩网友自拍| 久草热视频这里只有精品| 黄色美女日本的美女日人| 黑人粗大一区二区三区| 一区二区日本一区二区欧美| 午夜福利92在线观看| 99久免费精品视频在线观| 伊人欧美一区二区三区| 99久久精品视频一区二区| 福利视频一区二区在线| 熟女少妇久久一区二区三区| 色哟哟精品一区二区三区| 99久久精品午夜一区| 少妇人妻一级片一区二区三区 | 日本特黄特色大片免费观看| 欧美日韩一区二区三区色拉拉| 亚洲视频在线观看免费中文字幕| 97人妻精品一区二区三区免| 亚洲三级视频在线观看免费|