![Pandas数据分析快速上手500招(微课视频版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/35/47216035/b_47216035.jpg)
上QQ阅读APP看书,第一时间看更新
040 读取文本文件的数据并设置列类型
此案例主要通过在read_csv()函数中设置dtype参数值为指定的类型,实现读取以空格分隔数据的文本文件,并据此在创建DataFrame时设置列的数据类型。当在Jupyter Notebook中运行此案例代码之后,将设置股票代码列的数据类型为str,即将股票代码列的数据按照字符串的格式读取,而不是按照数字的格式读取,效果分别如图040-1和图040-2所示。
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P53_3618.jpg?sign=1739263304-df0PbBDnq35lRzDpuc351eUX37M4AVF8-0-13e00d8976102b40a51ecb45bf4ab200)
图040-1
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P53_3619.jpg?sign=1739263304-xixlua82jCnbQtIALVZ4EkL1NW34PEib-0-47d16c48947302a31d58206922d85c6f)
图040-2
主要代码如下。
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P53_3622.jpg?sign=1739263304-0A1Gl3HsoWtmsno4mjOAStUyOYL4fH6q-0-4c6c914a68569f79697bff4dbcdea7e9)
在上面这段代码中,pd.read_csv('myspace.txt',delim_whitespace=True,dtype={'股票代码': str})表示读取以空格分隔数据的文本文件(myspace.txt),并据此在创建DataFrame时设置股票代码列的数据类型为str;如果未设置dtype参数值,则股票代码列的数据类型默认是int64。
此案例的主要源文件是MyCode\H188\H188.ipynb。