Selenium如何通过js注入避免被检测

Selenium如何通过js注入避免被检测

 1. 前言

在使用Selenium进行模拟爬虫的时候,很多时候网站都会有一定的检测机制,能够检测出你这个是Selenium程序,比如淘宝网。

如何知道当前是否被检测,我们可以通过以下代码来进行检验:

window.navigator.webdriver

图片[1]-Selenium如何通过js注入避免被检测-个人心得体会分享

2. 检测当前是否被发现

我们打开开发者工具: F12

当我们复制上面代码的时候,会出现这个问题:

image

这个时候,我们输入:

允许粘贴

图片[1]-Selenium如何通过js注入避免被检测-个人心得体会分享

如果是英文提示,就输入:

allow pasting

图片[1]-Selenium如何通过js注入避免被检测-个人心得体会分享

image

我们发现这里是false,说明没被检测

这时,我们用seleniunm启动试一下:

image

3. 解决方案

我们采用一段js注入代码就行了:

from selenium.webdriver import ActionChains
from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options

option = Options()
option.add_experimental_option("detach", True)
driver = Chrome(options=option)

# Selenium在打开任何页面之前,先运行这个Js文件。

with open('./1.js') as f:
    js = f.read()

# 进行js注入,绕过检测

driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": js
})

driver.get('https://www.taobao.com')

 

附上js代码的地址:

https://download.csdn.net/download/xiao_a_lian/89752217

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容