版本信息:
print(sys.version) 3.5.1 |Anaconda 4.1.0 (64-bit)| (default, Jun 15 2016, 15:29:36) [MSC v.1900 64 bit (AMD64)]
我有一个数据框中的列,看起来像这样(经度和纬度是多级列):
+------------+---------------+--------------+--------------+ | CustomerId | StreetAddress | Latitude | Longitude | +------------+---------------+-------+------+-------+------+ | | count | mean | count | mean | +----------------------------+-------+------+-------+------+
我想得到这个:
+------------+---------------+-----------+----------+-----------+----------+ | CustomerId | StreetAddress | Lat_count | Lat_mean | Lon_count | Lon_mean | +------------+---------------+-----------+----------+-----------+----------+
我试过这个:
newColumns = ['CustomerId','StreetAddress','Lat_count','Lat_mean','Lon_count','Lon_mean'] data2 = data1.reindex(columns=newColumns)
但是,这绝对没有工作! 我结束了一些疯狂的多级列, newColumns
中每个string的每个字母是一个新的水平。
这是我的专栏
data1.columns.to_series() CustomerId (CustomerId, ) StreetAddress (StreetAddress, ) Latitude count (Latitude, count) mean (Latitude, mean) Longitude count (Longitude, count) mean (Longitude, mean)
这将做的伎俩:
data2 = pd.DataFrame(data1.values, columns=newColumns)
而且这个:
data1.columns = newColumns