python 離散型數(shù)據(jù)量化的方法可以采用變量轉(zhuǎn)換方法來解決,分類數(shù)據(jù)和連續(xù)數(shù)據(jù)需要參與模型計算,并且通常會轉(zhuǎn)換為數(shù)值數(shù)據(jù)。
創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站設(shè)計、網(wǎng)站制作、離石網(wǎng)絡(luò)推廣、成都微信小程序、離石網(wǎng)絡(luò)營銷、離石企業(yè)策劃、離石品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎;創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供離石建站搭建服務(wù),24小時服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com
當(dāng)然,某些算法允許這些數(shù)據(jù)直接參與計算,例如分類算法中的決策樹和關(guān)聯(lián)規(guī)則。將非數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)的最佳方法是將所有類別或有序變量的范圍從一列多值形式轉(zhuǎn)換為僅包含真值的多列。可以將True值傳遞給True,F(xiàn)alse或0、1。這種符號轉(zhuǎn)換方法有時稱為真值轉(zhuǎn)換。
具體代碼是:
import pandas as pddata = [.
['yellow', 'S', 10.1, 'class1'].
['red', 'M', 13.5, 'class1'].
['red', 'M', 15.1, 'class2'].
['blue', 'XL', 15.3, 'class2'.
df = pd.DataFrame(.
data,columns=['color', 'size', 'prize', 'class'].
python 離散型數(shù)據(jù)用連續(xù)數(shù)據(jù)處理的方法是:
1、等寬法:若數(shù)據(jù)區(qū)間為0~20,設(shè)置箱子個數(shù)為4個,則等寬法會將數(shù)據(jù)裝入4個箱子:[0,5],(5,10],(10,15],(15,20],并且可以設(shè)置每個箱子的名字,如1、2、3、4。
等寬法缺點(diǎn)是分箱結(jié)果會受到最值影響。并且需要人為指定箱子個數(shù),比較依賴于經(jīng)驗(yàn)。分箱結(jié)果會直接影響后續(xù)分類、聚類的結(jié)果。
2、等頻法:等頻法是指將一組數(shù)據(jù)分解成n個部分后,每個部分的記錄數(shù)量是一樣多的。等頻法常用pandas庫中的qcut()函數(shù)進(jìn)行處理。
不管是對量化分析師還是普通的投資者來說,K線圖(蠟燭圖)都是一種很經(jīng)典、很重要的工具。在K線圖中,它會繪制每天的最高價、最低價、開盤價和收盤價,這對于我們理解股票的趨勢以及每天的多空對比很有幫助。
一般來說,我們會從各大券商平臺獲取K線圖,但是這種情況下獲得的K線圖往往不能靈活調(diào)整,也不能適應(yīng)復(fù)雜多變的生產(chǎn)需求。因此我們有必要學(xué)習(xí)一下如何使用Python繪制K線圖。
需要說明的是,這里mpl_finance是原來的matplotlib.finance,但是現(xiàn)在獨(dú)立出來了(而且好像沒什么人維護(hù)更新了),我們將會使用它提供的方法來繪制K線圖;tushare是用來在線獲取股票數(shù)據(jù)的庫;matplotlib.ticker中有個FuncFormatter()方法可以幫助我們調(diào)整坐標(biāo)軸;matplotlib.pylab.date2num可以幫助我們將日期數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)化。
我們以上證綜指18年9月份以來的行情為例。
我們先使用mpl_finance繪制一下,看看是否一切正常。
可以看到,所有的節(jié)假日包括周末,在這里都會顯示為空白,這對于我們圖形的連續(xù)性非常不友好,因此我們要解決掉他們。
可以看到,空白問題完美解決,這里我們解釋一下。由于matplotlib會將日期數(shù)據(jù)理解為 連續(xù)數(shù)據(jù) ,而連續(xù)數(shù)據(jù)之間的間距是有意義的,所以非交易日即使沒有數(shù)據(jù),在坐標(biāo)軸上還是會體現(xiàn)出來。連續(xù)多少個非交易日,在坐標(biāo)軸上就對應(yīng)了多少個小格子,但這些小格子上方并沒有相應(yīng)的蠟燭圖。
明白了它的原理,我們就可以對癥下藥了。我們可以給橫坐標(biāo)(日期)傳入連續(xù)的、固定間距的數(shù)據(jù),先保證K線圖的繪制是連續(xù)的;然后生成一個保存有正確日期數(shù)據(jù)的列表,接下來,我們根據(jù)坐標(biāo)軸上的數(shù)據(jù)去取對應(yīng)的正確的日期,并替換為坐標(biāo)軸上的標(biāo)簽即可。
上邊f(xié)ormat_date函數(shù)就是這個作用。由于前邊我們給dates列生成了從0開始的序列連續(xù)數(shù)據(jù),因此我們可以直接把它當(dāng)作索引,從真正的日期列表里去取對應(yīng)的數(shù)據(jù)。在這里我們要使用matplotlib.ticker.FuncFormattter()方法,它允許我們指定一個格式化坐標(biāo)軸標(biāo)簽的函數(shù),在這個函數(shù)里,我們需要接受坐標(biāo)軸的值以及位置,并返回自定義的標(biāo)簽。
你學(xué)會了嗎?
當(dāng)然,一個完整的K線圖到這里并沒有結(jié)束,后邊我們會考慮加入均線、成交量等元素,感興趣的同學(xué)歡迎關(guān)注哦!
5個月。
python憑借其突出的語言優(yōu)勢與特性,已經(jīng)融入到各行各業(yè)的每個領(lǐng)域。一般來說,python培訓(xùn)需要脫產(chǎn)學(xué)習(xí)5個月左右,這樣的時長才能夠讓學(xué)員既掌握工作所需的技能,還能夠積累一定的項(xiàng)目經(jīng)驗(yàn)。當(dāng)然如果你想要在人工智能的路上越走越遠(yuǎn),則需要不斷的積累和學(xué)習(xí)。
python培訓(xùn)的5個月時間里,有相當(dāng)大一部分時間是在實(shí)戰(zhàn)做項(xiàng)目,第一階段是為期一個月學(xué)習(xí)python的核心編程,主要是python的語言基礎(chǔ)和高級應(yīng)用,幫助學(xué)員獲得初步軟件工程知識并樹立模塊化編程思想。學(xué)完這一階段的內(nèi)容,學(xué)員已經(jīng)能夠勝任python初級開發(fā)工程師的職位。
擴(kuò)展資料:
Python開發(fā)基礎(chǔ)課程內(nèi)容包括:計算機(jī)硬件、操作系統(tǒng)原理、安裝linux操作系統(tǒng)、linux操作系統(tǒng)維護(hù)常用命令、Python語言介紹、環(huán)境安裝、基本語法、基本數(shù)據(jù)類型、二進(jìn)制運(yùn)算、流程控制、字符編碼、文件處理、數(shù)據(jù)類型、用戶認(rèn)證、三級菜單程序、購物車程序開發(fā)、函數(shù)、內(nèi)置方法、遞歸、迭代器、裝飾器、內(nèi)置方法、員工信息表開發(fā)、模塊的跨目錄導(dǎo)入、常用標(biāo)準(zhǔn)庫學(xué)習(xí),b加密\re正則\logging日志模塊等,軟件開發(fā)規(guī)范學(xué)習(xí),計算器程序、ATM程序開發(fā)等。
參考資料來源:百度百科-Python量化交易從入門到實(shí)戰(zhàn)
本文將會講解量化投資過程中的基本流程,量化投資無非這幾個流程,數(shù)據(jù)輸入------策略書寫------回測輸出
其中策略書寫部分還涉及到編程語言的選擇,如果不想苦惱數(shù)據(jù)輸入和回測輸出的話,還要選擇回測平臺。
一、數(shù)據(jù)
首先,必須是數(shù)據(jù),數(shù)據(jù)是量化投資的基礎(chǔ)
如何得到數(shù)據(jù)?
Wind:數(shù)據(jù)來源的最全的還是Wind,但是要付費(fèi),學(xué)生可以有免費(fèi)試用的機(jī)會,之后還會和大家分享一下怎樣才Wind里摘取數(shù)據(jù),Wind有很多軟件的借口,Excel,Matlab,Python,C++。
預(yù)測者網(wǎng):不經(jīng)意間發(fā)現(xiàn),一個免費(fèi)提供股票數(shù)據(jù)網(wǎng)站 預(yù)測者網(wǎng),下載的是CSV格式
TB交易開拓者:Tradeblazer,感謝@孫存浩提供數(shù)據(jù)源
TuShare:TuShare -財經(jīng)數(shù)據(jù)接口包,基于Python的財經(jīng)數(shù)據(jù)包,利用Python進(jìn)行摘取
如何存儲數(shù)據(jù)?
Mysql
如何預(yù)處理數(shù)據(jù)?
空值處理:利用DataFrame的fill.na()函數(shù),將空值(Nan)替換成列的平均數(shù)、中位數(shù)或者眾數(shù)
數(shù)據(jù)標(biāo)準(zhǔn)化
數(shù)據(jù)如何分類?
行情數(shù)據(jù)
財務(wù)數(shù)據(jù)
宏觀數(shù)據(jù)
二、計算語言軟件
已經(jīng)有很多人在網(wǎng)上詢問過該選擇什么語言?筆者一開始用的是matlab,但最終選擇了python
python:庫很多,只有你找不到的,沒有你想不到,和量化這塊結(jié)合比較緊密的有:
NumpyScipy:科學(xué)計算庫,矩陣計算
Pandas:金融數(shù)據(jù)分析神器,原AQR資本員工寫的一個庫,處理時間序列的標(biāo)配
Matplotlib:畫圖庫
scikit-learn:機(jī)器學(xué)習(xí)庫
statsmodels:統(tǒng)計分析模塊
TuShare:免費(fèi)、開源的python財經(jīng)數(shù)據(jù)接口包
Zipline:回測系統(tǒng)
TaLib:技術(shù)指標(biāo)庫
matlab:主要是矩陣運(yùn)算、科學(xué)運(yùn)算這一塊很強(qiáng)大,主要有優(yōu)點(diǎn)是WorkSpace變量可視化
python的Numpy+Scipy兩個庫完全可以替代Matlab的矩陣運(yùn)算
Matplotlib完克Matlab的畫圖功能
python還有很多其他的功能
pycharm(python的一款I(lǐng)DE)有很棒的調(diào)試功能,能代替Matlab的WorkSpace變量可視化
推薦的python學(xué)習(xí)文檔和書籍
關(guān)于python的基礎(chǔ),建議廖雪峰Python 2.7教程,適合于沒有程序基礎(chǔ)的人來先看,涉及到python的基本數(shù)據(jù)類型、循環(huán)語句、條件語句、函數(shù)、類與對象、文件讀寫等很重要的基礎(chǔ)知識。
涉及到數(shù)據(jù)運(yùn)算的話,其實(shí)基礎(chǔ)教程沒什么應(yīng)用,python各類包都幫你寫好了,最好的學(xué)習(xí)資料還是它的官方文檔,文檔中的不僅有API,還會有寫實(shí)例教程
pandas文檔
statsmodels文檔
scipy和numpy文檔
matplotlib文檔
TuShare文檔
第二,推薦《利用Python進(jìn)行數(shù)據(jù)分析》,pandas的開發(fā)初衷就是用來處理金融數(shù)據(jù)的
三、回測框架和網(wǎng)站
兩個開源的回測框架
PyAlgoTrade - Algorithmic Trading
Zipline, a Pythonic Algorithmic Trading Library