例如Googlebot機器人會大量來採集web上的網頁,產生很多loading這時可以用這個方法來阻檔
1.編輯httpd.conf配置
#user-agent BrowserMatch "Googlebot" bad_bot BrowserMatch "360JK qiyunce" bad_bot BrowserMatch "Python-urllib" bad_bot BrowserMatch "WinHttp" bad_bot BrowserMatch "MJ12bot" bad_bot BrowserMatch "AhrefsBot" bad_bot BrowserMatch "HttpClient" bad_bot <Location /> Order Allow,Deny #Deny from env=bad_bot Allow from all Deny from env=bad_bot </Location>
2.重啟httpd
service httpd restart
驗證log會發現Googlebot會變成403代表被拒絕
網上常見惡意user-agent
BOT/0.1 (BOT for JCE) sql注入
CrawlDaddy sql注入
Java 內容採集
Jullo 內容採集
Feedly 內容採集
UniversalFeedParser 內容採集
ApacheBench cc攻擊器
Swiftbot 無用爬蟲
YandexBot 無用爬蟲
AhrefsBot 無用爬蟲
YisouSpider 無用爬蟲
jikeSpider 無用爬蟲
MJ12bot 無用爬蟲
ZmEu phpmyadmin 漏洞掃描
WinHttp 採集cc攻擊
EasouSpider 無用爬蟲
HttpClient tcp攻擊
Microsoft URL Control 掃描
YYSpider 無用爬蟲
jaunty wordpress爆破掃描器
oBot 無用爬蟲
Python-urllib 內容採集
Indy Library 掃描
FlightDeckReports Bot 無用爬蟲
Linguee Bot 無用爬蟲
參考資料:
https://blog.0xbbc.com/2015/01/apache%E8%BF%87%E6%BB%A4user-agent/