AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理泰国仓储,本土仓发货2-3元/单
指纹浏览器,就用AdsPower谷歌/FB/Bing/Yahoo代理商开户7200W全球动态不重复住宅IP代理全球优质流量,选TrafficStars
出售Facebook,友缘号,FB广告号,insFB/TT/KW 加白开户ADPLEXITY + ADVERTCN比Adplexity还好用的Spy工具
广
FB/Google/TK海外多媒体极速下户
BINOM TRACKER 60% OFF!MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量
百度国际MediaGo,独家原生流量虚拟信用卡+独立站收款行业首创新型指纹Cloak, 谷歌奇效!Kookeey⚡️100%独享⚡️原生住宅IP
⚡IPFoxy住宅代理全场88折⚡全球虚拟卡, 支持U充值免账户投放 FB 广告(送项目)2024做什么 - Media buy 项目库
免费黑五教程(持续更新、欢迎交流)Facebook 批量上广告Bridgeway - 联盟营销网络IPCola 全新住宅代理 ⚡️ 免费试用
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户Adsterra 的CPA/CPM/CPC 网站流量在线注册美国/英国/香港等海外公司
EU KETO/CBD - JumbleberryFB二三解1元/个9Proxy ⚡️ $0.04/IP, 无限带宽 cloak斗篷/ss/nutra/cpa/Dating
E.PN 虚拟卡Asocks代理服务器$3/GB高薪诚求实力FB投手(独立站)《全新虚拟卡+全球收付款》
广告位出租全球低价纯净住宅/移动IP-免费试用广告代投, 东南亚物流, 虚拟信用卡VMLogin指纹浏览器+多账号防关联
查看: 5650|回复: 6

利用文字识别批量去除文字类型水印。

[复制链接]

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
发表于 2018-8-28 13:18:00 | 显示全部楼层 |阅读模式
adsterra
本帖最后由 xiaoxue 于 2019-3-4 20:49 编辑

简单点的思路 。
图像转换jpg -> post 到 baiduAi -> 返回识别的文字(带坐标)-> 根据返回的坐标Image.new() 生成个#FFfff背景的图像->利用Image.paste() 把#fff图像覆盖住水印
  1. # -*- coding: utf-8 -*-
  2. from aip import AipOcr
  3. import time
  4. import random
  5. import sys,re
  6. import requests,json
  7. from PIL import Image, ImageDraw,ImageFont
  8. import base64
  9. # """ 你的 APPID AK SK """
  10. APP_ID = xxx'
  11. API_KEY = 'xxxx'
  12. SECRET_KEY = 'xxxxx'
  13. client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
  14. a = client.accurate(image)
  15. def get_file_content(filePath):
  16. with open(filePath, 'rb') as fp:
  17. return fp.read()
  18. def Wordfilter(words, arr):
  19.         for str in arr:
  20.                 if words.find(str) >=0:
  21.                         return True
  22.         return False
  23. for juzi in a['data']['words_result']:
  24.         filterKey = [‘股票学习网','股票','股票学习','股票学','习网','www.']
  25.         if Wordfilter(juzi['words'],filterKey):
  26.                 cropZB = juzi['location']
  27.                 left = cropZB['left']
  28.                 top = cropZB['top']
  29.                 right = left + cropZB['width']
  30.                 bottom = top + cropZB['height']
  31.                 TC_img = Image.new("RGB",(cropZB['width'],cropZB['height']),"#FFFFFF")
  32.                 im.paste(TC_img,(left, top, right, bottom))
  33.         
  34. im.save(file)
复制代码

处理前:

处理后:


一些小技巧:
im.resize((w*2, h*2),Image.ANTIALIAS)
im.resize((w*3, h*3),Image.ANTIALIAS)
im.resize((w*4, h*4),Image.ANTIALIAS)
通过修改 宽和高: 来提高 文字识别的准确率度。
处理完后im.resize((w, h),Image.ANTIALIAS).save('xx.jpg')

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

评分

参与人数 1广告币 +8 收起 理由
saveascj + 8 不懂代码,但纯支持。

查看全部评分

相关帖子
回复

使用道具 举报

2

主题

169

广告币

424

积分

中级会员

Rank: 3Rank: 3

积分
424
发表于 2018-8-30 09:19:04 | 显示全部楼层
现在已经进入 ai niche 站时代了,楼主有什么好玩的吗, 我在做采集翻译语音自动上传youtb一条龙的自动化站
回复 支持 反对

使用道具 举报

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
 楼主| 发表于 2018-8-30 14:53:01 来自手机 | 显示全部楼层
好玩的? 最近研采集  用百度ai做文章分类 tag 内链 去水印啥的。 youtube不审了 没得搞吧。
回复 支持 反对

使用道具 举报

3

主题

31

广告币

157

积分

初级会员

Rank: 2

积分
157

社区QQ达人

发表于 2018-9-15 23:19:50 | 显示全部楼层
楼主发的好玩啊

点评

多交流~ 紫薯补丁  详情 回复 发表于 2018-9-20 21:27
各种数据。
回复 支持 反对

使用道具 举报

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
 楼主| 发表于 2018-9-20 21:27:17 来自手机 | 显示全部楼层
blockmoon 发表于 2018-9-15 23:19
楼主发的好玩啊

多交流~ 紫薯补丁
回复 支持 反对

使用道具 举报

6

主题

303

广告币

310

积分

初级会员

Rank: 2

积分
310
 楼主| 发表于 2018-9-20 21:28:11 来自手机 | 显示全部楼层
facebook号专家 发表于 2018-9-19 09:03
楼主 漏脸了。。。哈哈

? fb小号咋卖的。
回复 支持 反对

使用道具 举报

直行转左 该用户已被删除
发表于 2018-9-30 00:39:23 | 显示全部楼层
最近也在搞采集翻译建站,用翻译出来可读性一般
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-4-26 18:55 , Processed in 0.055693 second(s), 19 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表