基礎(chǔ)
目前成都創(chuàng)新互聯(lián)公司已為上千余家的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬主機(jī)、網(wǎng)站托管維護(hù)、企業(yè)網(wǎng)站設(shè)計、溪湖網(wǎng)站維護(hù)等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。數(shù)據(jù)類型
Number整數(shù)/浮點數(shù)
String字符串
Boolean布爾值True和False
空值None不是0
Tuple元組類型不必統(tǒng)一(1,‘a(chǎn)bc’,0.4)
Dictionary key-value
List內(nèi)置數(shù)據(jù)類型:列表[1,‘a(chǎn)bc’,0.4],list是一種有序的集合,可以隨時添加和刪除其中的元素
變量
python是動態(tài)變量,不僅可以是數(shù)字,還可以是任意數(shù)據(jù)類型,是引用
與之對應(yīng)的是靜態(tài)變量,java是靜態(tài)變量
字符串
字符串可以用’'或者""括起來表示。
如果一個字符串包含很多需要轉(zhuǎn)義的字符,對每一個字符都進(jìn)行轉(zhuǎn)義會很麻煩。為了避免這種情況,我們可以在字符串前面加個前綴 r ,表示這是一個 raw 字符串,里面的字符就不需要轉(zhuǎn)義了。
r'\(~_~)/ \(~_~)/'
在多行字符串前面添加r,把這個多行字符串也變成一個raw字符串
r'''Python is created by "Guido".
It is free and easy to learn.
Let's start learn Python in imooc!'''
語法
if age = 20
if age >= 18:
print 'your age is', age
print 'adult'
print 'END'
dict
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
print 'Adam:', d['Adam']
print 'Lisa:', d['Lisa']
print 'Bart:', d['Bart']
注釋
單行注釋用#
多行注釋
“”"
“”"
編程庫
1.time
import time
print(time.time())
time = time.localtime( time.time() )
print(time)
print(time.tm_year)
"""
1563803665.310865
time.struct_time(tm_year=2019, tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)
2019
"""
2.Matplotlib
繪圖工具包
3.Scikit-learn
封裝了大量經(jīng)典以及最新的機(jī)器學(xué)習(xí)模型
4.Pandas
針對于數(shù)據(jù)處理和分析的python工具包,實現(xiàn)了大量便于數(shù)據(jù)讀寫,清洗,填充及分析功能
4.1讀取文件
import pandas as pd
# 兩個數(shù)據(jù)類型:Series, DataFrame
data_path = "C:/Users/admin/Desktop/111.csv"
# 讀取文件
def read_file(data_path):
datas = pd.read_csv(data_path, encoding="GBK")
datas = datas.dropna()
return datas
data = read_file(data_path)
print(data)無錫好的×××醫(yī)院 http://www.zzchnk.com/
# 獲取某一列文字 Python 字典(Dictionary) -->contents_agent 轉(zhuǎn)化成一整段
contents_agent = data["asr_agent_raw"]
contents = contents_agent.values.tolist()
5.jieba
import jieba
stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"
def seg_word(contents):
contents = contents.values.tolist()
jieba.load_userdict(stopwords_file)
segment = []
for line in contents:
try:
segs = jieba.lcut(line)
for seg in segs:
if len(seg) > 1 and seg != '\r\n' and \
u'\u4e00' <= seg <= u'\u9fa5' or \
u'\u0041' <= seg <= u'\u005a' or \
u'\u0061' <= seg <= u'\u007a':
segment.append(seg)
except:
print(line)
continue
words_df = pd.DataFrame({'words': segment})
stopwords = pd.read_csv(stopwords_file,
index_col=False,
quoting=3,
sep="\t",
names=['stopwords'],
encoding='utf-8') # quoting=3全不引用
words_df = words_df[~words_df.words.isin(stopwords.stopwords)]
return words_df
# 進(jìn)行分詞
words_agent = seg_word(contents_agent)
print(words_agent)
6.NumPy & SciPy
NumPy最基礎(chǔ)的編程庫,提供一些高級的數(shù)學(xué)運算機(jī)制和高效的向量和矩陣運算功能
SciPy是子啊NumPy的基礎(chǔ)上構(gòu)建的,更為強(qiáng)大的科學(xué)計算包
import numpy as np
def word_freq(words_df):
words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})
words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)
return words_stat
words_stat_agent = word_freq(words_agent)
# 打印詞頻較高的前10
print(words_stat_agent.head(10))
7.Anaconda平臺
一次性獲得300多種用于科學(xué)和工程計算相關(guān)任務(wù)的python編程庫的支持
人工智能-推薦算法理論應(yīng)用場景
基于內(nèi)容的推薦系統(tǒng)原理
代價函數(shù).
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。