小編給大家分享一下Python如何實現(xiàn)E-Mail收集插件,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
成都創(chuàng)新互聯(lián)堅持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站建設(shè)、成都網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時代的姚安網(wǎng)站設(shè)計、移動媒體設(shè)計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!__import__函數(shù)
我們都知道import是導(dǎo)入模塊的,但是其實import實際上是使用builtin函數(shù)import來工作的。在一些程序中,我們可以動態(tài)去調(diào)用函數(shù),如果我們知道模塊的名稱(字符串)的時候,我們可以很方便的使用動態(tài)調(diào)用
def getfunctionbyname(module_name, function_name): module = __import__(module_name) return getattr(module, function_name)
通過這段代碼,我們就可以簡單調(diào)用一個模塊的函數(shù)了
插件系統(tǒng)開發(fā)流程
一個插件系統(tǒng)運轉(zhuǎn)工作,主要進行以下幾個方面的操作
獲取插件,通過對一個目錄里的.py文件掃描得到
將插件目錄加入到環(huán)境變量sys.path
爬蟲將掃描好的 URL 和網(wǎng)頁源碼傳遞給插件
插件工作,工作完畢后將主動權(quán)還給掃描器
插件系統(tǒng)代碼
在lib/core/plugin.py中創(chuàng)建一個spiderplus類,實現(xiàn)滿足我們要求的代碼
# __author__ = 'mathor' import os import sys class spiderplus(object): def __init__(self, plugin, disallow = []): self.dir_exploit = [] self.disallow = ['__init__'] self.disallow.extend(disallow) self.plugin = os.getcwd() + '/' + plugin sys.path.append(plugin) def list_plusg(self): def filter_func(file): if not file.endswith('.py'): return False for disfile in self.disallow: if disfile in file: return False return True dir_exploit = filter(filter_func, os.listdir(self.plugin) return list(dir_exploit) def work(self, url, html): for _plugin in self.list_plusg(): try: m = __import__(_plugin.split('.')[0]) spider = getattr(m, 'spider') p = spider() s = p.run(url, html) except Exception as e: print (e)
work函數(shù)中需要傳遞 url,html,這個就是我們掃描器傳給插件系統(tǒng)的,通過代碼
spider = getattr(m, 'spider') p = spider() s = p.run(url, html)
我們定義插件必須使用class spider中的run方法調(diào)用
掃描器中調(diào)用插件
我們主要用爬蟲調(diào)用插件,因為插件需要傳遞 url 和網(wǎng)頁源碼這兩個參數(shù),所以我們在爬蟲獲取到這兩個的地方加入插件系統(tǒng)代碼即可
首先打開Spider.py,在Spider.py文件開頭加上
from lib.core import plugin
然后在文件的末尾加上
disallow = ['sqlcheck'] _plugin = plugin.spiderplus('script', disallow) _plugin.work(_str['url'], _str['html'])
disallow是不允許的插件列表,為了方便測試,我們可以把 sqlcheck 填上
SQL 注入融入插件系統(tǒng)
其實非常簡單,只需要修改script/sqlcheck.py為下面即可
關(guān)于Download模塊,其實就是Downloader模塊,把Downloader.py復(fù)制一份命名為Download.py就行
import re, random from lib.core import Download class spider: def run(self, url, html): if (not url.find("?")): # Pseudo-static page return false; Downloader = Download.Downloader() BOOLEAN_TESTS = (" AND %d=%d", " OR NOT (%d=%d)") DBMS_ERRORS = { # regular expressions used for DBMS recognition based on error message response "MySQL": (r"SQL syntax.*MySQL", r"Warning.*mysql_.*", r"valid MySQL result", r"MySqlClient\."), "PostgreSQL": (r"PostgreSQL.*ERROR", r"Warning.*\Wpg_.*", r"valid PostgreSQL result", r"Npgsql\."), "Microsoft SQL Server": (r"Driver.* SQL[\-\_\ ]*Server", r"OLE DB.* SQL Server", r"(\W|\A)SQL Server.*Driver", r"Warning.*mssql_.*", r"(\W|\A)SQL Server.*[0-9a-fA-F]{8}", r"(?s)Exception.*\WSystem\.Data\.SqlClient\.", r"(?s)Exception.*\WRoadhouse\.Cms\."), "Microsoft Access": (r"Microsoft Access Driver", r"JET Database Engine", r"Access Database Engine"), "Oracle": (r"\bORA-[0-9][0-9][0-9][0-9]", r"Oracle error", r"Oracle.*Driver", r"Warning.*\Woci_.*", r"Warning.*\Wora_.*"), "IBM DB2": (r"CLI Driver.*DB2", r"DB2 SQL error", r"\bdb2_\w+\("), "SQLite": (r"SQLite/JDBCDriver", r"SQLite.Exception", r"System.Data.SQLite.SQLiteException", r"Warning.*sqlite_.*", r"Warning.*SQLite3::", r"\[SQLITE_ERROR\]"), "Sybase": (r"(?i)Warning.*sybase.*", r"Sybase message", r"Sybase.*Server message.*"), } _url = url + "%29%28%22%27" _content = Downloader.get(_url) for (dbms, regex) in ((dbms, regex) for dbms in DBMS_ERRORS for regex in DBMS_ERRORS[dbms]): if (re.search(regex,_content)): return True content = {} content['origin'] = Downloader.get(_url) for test_payload in BOOLEAN_TESTS: # Right Page RANDINT = random.randint(1, 255) _url = url + test_payload % (RANDINT, RANDINT) content["true"] = Downloader.get(_url) _url = url + test_payload % (RANDINT, RANDINT + 1) content["false"] = Downloader.get(_url) if content["origin"] == content["true"] != content["false"]: return "sql found: %" % url
E-Mail 搜索插件
最后一個簡單的例子,搜索網(wǎng)頁中的 E-Mail,因為插件系統(tǒng)會傳遞網(wǎng)頁源碼,我們用一個正則表達式([\w-]+@[\w-]+\.[\w-]+)+搜索出所有的郵件。創(chuàng)建script/email_check.py文件
# __author__ = 'mathor'
import re class spider(): def run(self, url, html): #print(html) pattern = re.compile(r'([\w-]+@[\w-]+\.[\w-]+)+') email_list = re.findall(pattern, html) if (email_list): print(email_list) return True return False
運行python w8ay.py
可以看到網(wǎng)頁中的郵箱都被采集到了
以上是“Python如何實現(xiàn)E-Mail收集插件”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計公司行業(yè)資訊頻道!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。