我参考你的pytorch代码，改为读取图片，下载了350张验证码，100张做验证集，5张测试，其它的都训练。 Loss 0.001 : 250 epoch

<a class="user-mention notranslate" data-hovercard-type="user" data-hover

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

请问可以留一个您的联系方式吗？我这修改了还是有一些小问题…发自我的iPhone <span class="email-hid

楼主，请教 about captcha_break HOT 13 OPEN

ypwhs commented on July 24, 2024

楼主，请教

from captcha_break.

Comments (13)

armstrong1972 commented on July 24, 2024 1

感谢大佬指点。
我想50%的识别率，每2张中就能认出1张，还是可以用的。
我程序加了个小技巧：每次验证码都按时间戳做文件名存盘。凡是通过验证进入下一页面的，我就将文件名改为验证码。这样至少有一半的图片是自动打了标签的（手工打太累了）。
于是乎一上午又多了300多张可用的样板，重新学习后，识别率高达93%。

from captcha_break.

armstrong1972 commented on July 24, 2024 1

@armstrong1972 你好，请问应该如何修改读取自己的图片数据集呢？小白完全不懂该如何下手....

修改 CaptchaDataset 类即可，给你个文件做参考
只要在主程序下，建2个子目录：
img/train 放train的图片
img/valid 放valid的图片

主程序内删除 CaptchaDataset 类所有代码，头部增加：

from dset_files import CaptchaDataset

dset_files.zip

from captcha_break.

ypwhs commented on July 24, 2024

增加数据量

from captcha_break.

ypwhs commented on July 24, 2024

凡是通过验证进入下一页面的，我就将文件名改为验证码。

这是非常好的思路。

from captcha_break.

BerryRB commented on July 24, 2024

@armstrong1972 你好，请问应该如何修改读取自己的图片数据集呢？小白完全不懂该如何下手....

from captcha_break.

BerryRB commented on July 24, 2024

请问可以留一个您的联系方式吗？我这修改了还是有一些小问题… 发自我的iPhone

…

------------------ 原始邮件 ------------------ 发件人: Armstrong Li <[email protected]> 发送时间: 2019年10月10日 16:45 收件人: ypwhs/captcha_break <[email protected]> 抄送: BerryRB <[email protected]>, Comment <[email protected]> 主题: 回复：[ypwhs/captcha_break] 楼主，请教 (#38) @armstrong1972 你好，请问应该如何修改读取自己的图片数据集呢？小白完全不懂该如何下手.... 修改 CaptchaDataset 类即可，给你个文件做参考只要在主程序下，建2个子目录： img/train 发train的图片 img/valid 发valid的图片主程序内删除 CaptchaDataset 类所有代码，头部增加：从不同文件导入 CaptchaDataset 类，实现不同的数据读取方法 #from dset_auto import CaptchaDataset from dset_files import CaptchaDataset dset_files.zip — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.

from captcha_break.

armstrong1972 commented on July 24, 2024

[email protected]

from captcha_break.

Pinndanyi commented on July 24, 2024

请问您是怎么实现保存验证码的？我目前是用selenium + chrome + pyautogui实现的，但是现在需要将chrome设为headless，那pyautogui的右键保存功能就不能用了。请问您有别的方法吗？

from captcha_break.

armstrong1972 commented on July 24, 2024

不要用 pyautogui ，selenium 本身就有存图片的功能

from selenium import webdriver
PATH_ChromeDriver = "chromedriver.exe"
drvChrome = webdriver.Chrome(PATH_ChromeDriver)

drvChrome.get(HOME_PAGE)
imgVC=drvChrome.find_element_by_id("id_of_captcha")
f_vcode = basepath + "/img/__temp.png"
with open(f_vcode,'wb') as fp:
fp.write(imgVC.screenshot_as_png)

from captcha_break.

Pinndanyi commented on July 24, 2024

很好用，非常感谢！因为变成120*30像素的png了，用作者的模型就报错了，

RuntimeError: Given groups=1, weight of size 32 3 3 3, expected input[128, 4, 30, 120] to have 3 channels, but got 4 channels instead

我想是因为jpg3个通道，png4个通道的缘故，但是不会改模型参数，劳请您再指教下！谢谢！

from captcha_break.

armstrong1972 commented on July 24, 2024

抱歉忘了提醒了，需要你去找个工具批量将他们改为 jpg 3通道文件。

from captcha_break.

armstrong1972 commented on July 24, 2024

或者：用程序读取4通道png，然后转成3通道

from PIL import Image
im = Image.open(im_path)
if im.shape[2] == 4:
im =im.convert("RGB")

from captcha_break.

tangbinchn commented on July 24, 2024

或者：用程序读取4通道png，然后转成3通道

from PIL import Image
im = Image.open(im_path)
if im.shape[2] == 4:
im =im.convert("RGB")

您好，我在修改为读取图片测试时，遇到这样的问题：
RuntimeError: input.size(-1) must be equal to input_size. Expected 512, got 256
应该是输入尺寸的问题，但是我不清楚在哪里修改，劳烦指教一下，谢谢

from captcha_break.

楼主，请教 about captcha_break HOT 13 OPEN

Comments (13)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent