При использовании селена с браузером Chrome для автоматизации,нуждаться Конфигурацияchromedriver
Для управления браузером, поскольку браузер Chrome был обновлен до версии 115, последняя версия драйвера, предоставленная по ранее указанному адресу загрузки или обычно используемому изображению Taobao в Китае, — 114.
После недолгих поисков я нашел адрес загрузки драйверов версии 115 и новее следующим образом:
pip install webdriver-manager -U
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
# selenium 4
from selenium import webdriver
from selenium.webdriver.chrome.service import Service as ChromeService
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()))
Возьмем, к примеру, вождение браузера Chrome.,Прежде чем использовать webdriver_manager,Наш скрипт для запуска Chrome выглядит следующим образом,Вам необходимо самостоятельно указать путь к chromedriver или добавить Конфигурацию в переменную среды.
from selenium import webdriver
driver = webdriver.Chrome('/home/user/drivers/chromedriver')
После использованияwebdriver_manager нам нужно только заменить это предложение
driver = webdriver.Chrome(ChromeDriverManager().install())
очевидно ChromeDriverManager().install()
вернулсяchromedriverпуть,Поэтому мы в основном смотрим наinstall()
Реализация метода,Прочитав исходный код, я обнаружил, что общий процесс выглядит следующим образом:
driver.json
Есть ли драйвер этой версии?,Если есть прямой обратный путь,Если нет, то скачайте def _get_driver_binary_path(self, driver):
binary_path = self._cache_manager.find_driver(driver)
if binary_path:
return binary_path
os_type = self.get_os_type()
file = self._download_manager.download_file(driver.get_driver_download_url(os_type))
binary_path = self._cache_manager.save_file_to_cache(driver, file)
return binary_path
.wdm/drivers
в папке,и создатьdriver.json
Связь между версией обслуживания файла и путем к драйверу,Если это ваш первый раз, используйте,Будут созданы соответствующие каталоги и файлы.{
"mac64_chromedriver_119.0.6045.0_for_119.0.6045": {
"timestamp": "15/11/2023",
"binary_path": "/Users/jack/.wdm/drivers/chromedriver/mac64/119.0.6045.0/chromedriver-mac-x64/chromedriver"
}
}
webdriver.Chrome()
серединаПри автоматической загрузке исходный код определяет, является ли версия Chrome после 115, а затем переходит к соответствующему URL-адресу для загрузки. Однако независимо от того, находится ли она до или после 115, все они являются внешними URL-адресами. При плохой сетевой среде. загрузка будет медленной и неудачной.
def get_driver_download_url(self, os_type):
driver_version_to_download = self.get_driver_version_to_download()
# For Mac ARM CPUs after version 106.0.5249.61 the format of OS type changed
# to more unified "mac_arm64". For newer versions, it'll be "mac_arm64"
# by default, for lower versions we replace "mac_arm64" to old format - "mac64_m1".
if version.parse(driver_version_to_download) < version.parse("106.0.5249.61"):
os_type = os_type.replace("mac_arm64", "mac64_m1")
if version.parse(driver_version_to_download) >= version.parse("115"):
if os_type == "mac64":
os_type = "mac-x64"
if os_type in ["mac_64", "mac64_m1", "mac_arm64"]:
os_type = "mac-arm64"
modern_version_url = self.get_url_for_version_and_platform(driver_version_to_download, os_type)
log(f"Modern chrome version {modern_version_url}")
return modern_version_url
return f"{self._url}/{driver_version_to_download}/{self.get_name()}_{os_type}.zip"
После понимания описанного выше процесса нам нужно только переписать соответствующие методы и классы и заменить их вышеупомянутыми внутренними зеркальными веб-сайтами.
ext/webdriver_manage_extend.py
документ,Напишите следующий контентimport os
from typing import Optional
from packaging import version
from webdriver_manager.core.logger import log
from webdriver_manager.core.download_manager import DownloadManager
from webdriver_manager.core.driver_cache import DriverCacheManager
from webdriver_manager.core.manager import DriverManager
from webdriver_manager.core.os_manager import OperationSystemManager, ChromeType
from webdriver_manager.drivers.chrome import ChromeDriver
class ExtChromeDriver(ChromeDriver):
def get_driver_download_url(self, os_type):
driver_version_to_download = self.get_driver_version_to_download()
# For Mac ARM CPUs after version 106.0.5249.61 the format of OS type changed
# to more unified "mac_arm64". For newer versions, it'll be "mac_arm64"
# by default, for lower versions we replace "mac_arm64" to old format - "mac64_m1".
if version.parse(driver_version_to_download) < version.parse("106.0.5249.61"):
os_type = os_type.replace("mac_arm64", "mac64_m1")
if version.parse(driver_version_to_download) >= version.parse("115"):
if os_type == "mac64":
os_type = "mac-x64"
if os_type in ["mac_64", "mac64_m1", "mac_arm64"]:
os_type = "mac-arm64"
modern_version_url = self.get_url_for_version_and_platform(driver_version_to_download, os_type)
log(f"Modern chrome version {modern_version_url}")
return modern_version_url
return f"{self._url}/{driver_version_to_download}/{self.get_name()}_{os_type}.zip"
def get_browser_type(self):
return self._browser_type
def get_latest_release_version(self):
determined_browser_version = self.get_browser_version_from_os()
log(f"Get LATEST {self._name} version for {self._browser_type}")
if determined_browser_version is not None and version.parse(determined_browser_version) >= version.parse("115"):
url = "https://registry.npmmirror.com/-/binary/chrome-for-testing"
response = self._http_client.get(url)
response_list = response.json()
determined_browser_version = self.get_version_form_net(determined_browser_version, response_list)
if determined_browser_version.endswith("/"):
determined_browser_version = determined_browser_version[:-1]
return determined_browser_version
# Remove the build version (the last segment) from determined_browser_version for version < 113
determined_browser_version = ".".join(determined_browser_version.split(".")[:3])
latest_release_url = (
self._latest_release_url
if (determined_browser_version is None)
else f"{self._latest_release_url}_{determined_browser_version}"
)
resp = self._http_client.get(url=latest_release_url)
return resp.text.rstrip()
def get_version_form_net(self, os_version, net_versions):
for v in net_versions:
if os_version in v["name"]:
return v["name"]
raise Exception(f"No such driver version {os_version} for {self._browser_type}")
def get_url_for_version_and_platform(self, browser_version, platform):
base_url = f"https://registry.npmmirror.com/-/binary/chrome-for-testing/{browser_version}/"
platform_path_map = {
'linux64': 'linux64/chromedriver-linux64.zip',
'mac-x64': 'mac-x64/chromedriver-mac-x64.zip',
'mac-arm64': 'mac-arm64/chromedriver-mac-arm64.zip',
'win32': 'win32/chromedriver-win32.zip',
'win64': 'win64/chromedriver-win64.zip',
}
download_url = base_url + platform_path_map[platform]
return download_url
class ChromeDriverManager(DriverManager):
def __init__(
self,
driver_version: Optional[str] = None,
name: str = "chromedriver",
url: str = "https://registry.npmmirror.com/-/binary/chromedriver",
latest_release_url: str = "https://registry.npmmirror.com/-/binary/chromedriver/LATEST_RELEASE",
chrome_type: str = ChromeType.GOOGLE,
download_manager: Optional[DownloadManager] = None,
cache_manager: Optional[DriverCacheManager] = None,
os_system_manager: Optional[OperationSystemManager] = None
):
super().__init__(
download_manager=download_manager,
cache_manager=cache_manager,
os_system_manager=os_system_manager
)
self.driver = ExtChromeDriver(
name=name,
driver_version=driver_version,
url=url,
latest_release_url=latest_release_url,
chrome_type=chrome_type,
http_client=self.http_client,
os_system_manager=os_system_manager
)
def install(self) -> str:
driver_path = self._get_driver_binary_path(self.driver)
os.chmod(driver_path, 0o755)
return driver_path
def get_url_for_version_and_platform(self, browser_version, platform):
base_url = f"https://registry.npmmirror.com/-/binary/chrome-for-testing/{browser_version}/"
platform_path_map = {
'linux64': 'linux64/chromedriver-linux64.zip',
'mac-x64': 'mac-x64/chromedriver-mac-x64.zip',
'mac-arm64': 'mac-arm64/chromedriver-mac-arm64.zip',
'win32': 'win32/chromedriver-win32.zip',
'win64': 'win64/chromedriver-win64.zip',
}
download_url = base_url + platform_path_map[platform]
return download_url
# selenium 3
from selenium import webdriver
from ext.webdriver_manage_extend import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
# selenium 4
from selenium import webdriver
from selenium.webdriver.chrome.service import Service as ChromeService
from ext.webdriver_manage_extend import ChromeDriverManager
driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()))
driver.get('https://www.baidu.com')
Таким образом, независимо от того, какая у вас версия браузера Chrome и обновляется ли Chrome автоматически, файлами драйверов можно управлять автоматически без каких-либо проблем.