24小时热门版块排行榜    

查看: 4188  |  回复: 7
【悬赏金币】回答本帖问题,作者xioashazi将赠送您 10 个金币

xioashazi

新虫 (小有名气)

[求助] 数据抽取

求助抽取pdf上的所需字段~~有偿!

发自小木虫IOS客户端
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wolfghost

版主 (知名作家)

优秀版主优秀版主优秀版主优秀版主优秀版主

【答案】应助回帖

楼主的使用图片识别就可以实现目标了。手机端,照片里有图片转文字,WPS里也有自带的。
大刀向鬼子的头上砍去!ChopJapstoDeath!
2楼2024-01-07 10:48:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xioashazi

新虫 (小有名气)

楼主的是有几千个pdf,批量抽取pdf上所需要的字段该如何实现

发自小木虫IOS客户端
3楼2024-01-07 15:19:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xioashazi

新虫 (小有名气)

引用回帖:
2楼: Originally posted by wolfghost at 2024-01-07 10:48:41
楼主的使用图片识别就可以实现目标了。手机端,照片里有图片转文字,WPS里也有自带的。

谢谢你,但是我的是有几千个pdf,是否可以
通过一些代码之类的实现批量抽取呢

发自小木虫IOS客户端
4楼2024-01-07 15:20:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wolfghost

版主 (知名作家)

优秀版主优秀版主优秀版主优秀版主优秀版主

引用回帖:
4楼: Originally posted by xioashazi at 2024-01-07 15:20:56
谢谢你,但是我的是有几千个pdf,是否可以
通过一些代码之类的实现批量抽取呢
...

这个就没有代码经验了;要得急的话就可以打“呆战”———分多人,多次处理。
大刀向鬼子的头上砍去!ChopJapstoDeath!
5楼2024-01-08 08:38:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

MrJohnny

新虫 (小有名气)

是纯图片转的pdf还是word之类的转的?如果是word之类转的,我或许可以用python来试一下帮你抽取字段

发自小木虫Android客户端
敢于直面惨淡的人生,敢于正视淋漓的鲜血
6楼2024-01-14 22:31:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wc596520206

金虫 (正式写手)

【答案】应助回帖

多个文档可以使用python写代码,主要使用的库有paddleocr做字符识别就行,但是我试验过效果不是特别好,有的时候需要将pdf转成word
7楼2024-01-15 09:47:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

me_yu

木虫 (正式写手)

【答案】应助回帖

内容已删除
听,寂静的夜里,田野里蛙声和虫鸣,好不欢快!
8楼2024-04-19 09:07:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xioashazi 的主题更新
不应助 确定回帖应助 (注意:应助才可能被奖励,但不允许灌水,必须填写15个字符以上)
信息提示
请填处理意见