不同 Python 數(shù)據(jù)類型的搜尋
創(chuàng)新互聯(lián)公司長(zhǎng)期為成百上千家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為清澗企業(yè)提供專業(yè)的網(wǎng)站制作、成都網(wǎng)站設(shè)計(jì),清澗網(wǎng)站改版等技術(shù)服務(wù)。擁有十年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。語(yǔ)言: Python 3.7.2
系統(tǒng): Win10 Ver. 10.0.17763
主題: 004.01 不同 Python 數(shù)據(jù)類型的搜尋
最近在做資料搜索比對(duì)的案子的時(shí)候,發(fā)現(xiàn)大量的數(shù)據(jù)在搜索比對(duì)時(shí),速度變的非常慢,慢到完全無(wú)法接受,我想要的是 ' 立即 ' 有結(jié)果,結(jié)果卻是要等好幾小時(shí),暈!雖然以 Python 來說,肯定比不上 C 或 Assembly 語(yǔ)言,但是還是要想辦法提升一下速度。以下是在一萬(wàn)筆數(shù)據(jù)中,找一萬(wàn)筆數(shù)據(jù)的各種方法以及所需的時(shí)間,雖然最后一個(gè)方法 index_list_sort(), 速度快了多,但是我還是覺得不夠快,而且這里還只是整數(shù)的搜索,如果是字符串呢?如果是副字符串呢?各位如果有更好的方法,也請(qǐng)?zhí)崾?,謝謝!
結(jié)果:
0:00:04.734338 : index_sequence
0:00:01.139984 : index_list
0:00:00.330116 : index_np
0:00:00.233343 : index_np_sort
0:00:00.223401 : index_dict
0:00:00.213462 : index_set
0:00:00.007977 : index_list_sort
代碼:
代碼:from datetime import datetime
import numpy as np
import bisect
import time
import random
import inspect
import copy
size = 10000
value = size-1
db = random.sample(range(size), size)
db_sort = copy.deepcopy(db)
db_sort.sort()
db_set = set(db)
db_dict = {db[i]:i for i in range(size)}
db_np = np.array(db)
value = [i for i in range(size)]
def call(func):
# Call function and calculate execution time, then print duration and function name
start_time = datetime.now()
func()
print(datetime.now() - start_time,':',func.__name__)
def do_something():
# Do something here, it may get duration different when multi-loop method used
for i in range(1000):
pass
def index_sequence():
# List unsort and just by Python without any method used or built-in function.
for i in range(size):
for j in range(size):
if value[j] == db[i]:
index = j
do_something()
break
def index_list():
# Unsorted list, use list.index()
for i in range(size):
try:
index = db.index(value[i])
except:
index = -1
if index >= 0:
do_something()
def index_np():
# By using numpy and np(where)
for i in range(size):
result = np.where(db_np==value[i])
if len(result[0])!=0:
do_something()
def index_np_sort():
# By using numpy and sorted numpy array
for i in range(size):
result = np.searchsorted(db_np, value[i])
if result != size:
do_something()
def index_list_sort():
# By using bisect library
for i in range(size):
index = bisect.bisect_left(db, value[i])
if index < size-1 and value[index]==db[index]:
do_something()
def index_set():
# Set serach
for i in range(size):
if value[i] in db_set:
do_something()
def index_dict():
# Dictionary search
for i in range(size):
try:
index = db_dict[value[i]]
except:
index = -1
if index >= 0:
do_something()
call(index_sequence)
call(index_list)
call(index_np)
call(index_np_sort)
call(index_dict)
call(index_set)
call(index_list_sort)復(fù)制代碼 database search
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。