Travel Tips
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Python数据分析实战——中国城市资本流动问题探索一
数据:全国2013-2016所有企业间的投融资信息数据
import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import warnings warnings.filterwarnings('ignore') # 不发出警告 from bokeh.io import output_notebook output_notebook() # 导入notebook绘图模块 from bokeh.plotting import figure,show from bokeh.models import ColumnDataSource,HoverTool # 导入图表绘制、图标展示模块 # 导入ColumnDataSource模块
'''
查看全国城际控股型投资关系
要求:
① 通过“data.xlsx”导出csv后,直接通过gephi看全国投资情况,有什么发现?
② 分别筛选出“同城投资”、“跨城投资”的TOP20,比较一下两类投资的数据分布
** 按照2013-2016年的汇总数据来计算
** 分开比较2013-2016四个年度的数据
** 需要绘制柱状图来辅助分析,这里用matplotlib即可
提示:
① 原始数据中,同一年中的投资数据会重复记录,所以需要将数据以'投资方所在城市','融资方所在城市','年份'这三个字段做一个分组汇总
② 用df.plot(kind = 'bar')来绘制图表,这里index为城市名即可
'''
# 数据读取,筛选出“同城投资”、“跨城投资”数据 df = pd.read_excel('/home/zty/Documents/python/Python进阶数据分析及可视化/实战/练习07_中国城市资本流动问题探索/data.xlsx') # 数据读取 df = df.groupby(['投资方所在城市','融资方所在城市','年份']).sum().reset_index() # 汇总数据 data_tc = df[df['投资方所在城市'] == df['融资方所在城市']] data_tc = data_tc.sort_values(by = '投资企业对数',ascending = False).reset_index() del data_tc['index'] # 筛选出“同城投资”数据 data_kc = df[df['投资方所在城市'] != df['融资方所在城市']] data_kc = data_kc.sort_values(by = '投资企业对数',ascending = False).reset_index() del data_kc['index'] # 筛选出“跨城投资”数据 # 比较一下“同城投资”、“跨城投资”TOP20的数据分布 # 按照2013-2017年的汇总数据来计算,比较 tc_sum = data_tc.groupby(['投资方所在城市','融资方所在城市']).sum().sort_values(by = '投资企业对数',ascending = False) del tc_sum['年份'] # 汇总“同城投资”数据 kc_sum = data_kc.groupby(['投资方所在城市','融资方所在城市']).sum().sort_values(by = '投资企业对数',ascending = False) del kc_sum['年份'] # 汇总“跨城投资”数据 # 查看“同城投资” tc_sum.iloc[:20]
# 查看“跨城投资” kc_sum.iloc[:20]
tc_sum.iloc[:20].plot(kind = 'bar',grid = True, figsize = (10,4),color = 'blue',alpha = 0.7) kc_sum.iloc[:20].plot(kind = 'bar',grid = True, figsize = (10,4),color = 'green',alpha = 0.7)
# ① 从2013-2016的汇总数据来看,投资比数“同城投资”>“跨城投资”
# ② “同城投资”中领头的城市为北上广深及部分二线强城市,其中 深圳>北京>上海>>其他城市
# ③ “跨城投资”中领头的城市仍为北上广深(相互投资),或者北上广深向周边城市投资(城市群)
def f1(year): tc_year = data_tc[data_tc['年份'] == year].sort_values(by = '投资企业对数',ascending = False) kc_year = data_kc[data_kc['年份'] == year].sort_values(by = '投资企业对数',ascending = False) tc_year.index = tc_year['投资方所在城市'] kc_year.index = kc_year['投资方所在城市'] + '-' + kc_year['融资方所在城市'] # 筛选该年的“同城投资”、“跨城投资” #print('%i年同城投资TOP20:' % year) #print(tc_year.iloc[:20]) #print('-----') #print('%i年跨城投资TOP20:' % year) #print(kc_year.iloc[:20]) #print('-----') return(tc_year.iloc[:20],kc_year.iloc[:20]) # 输出该年“同城投资”、“跨城投资”TOP20 # 创建函数 # 绘制图表 fig,axes = plt.subplots(4,2,figsize=(12,15)) plt.subplots_adjust(wspace = 0.1,hspace=0.5) f1(2013)[0]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'blue',alpha = 0.7,ax = axes[0,0],title = '同城投资 - 2013年',ylim = [0,40000]) f1(2013)[1]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'green',alpha = 0.7,ax = axes[0,1],title = '跨城投资 - 2013年',ylim = [0,3000]) # 2013年 f1(2014)[0]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'blue',alpha = 0.7,ax = axes[1,0],title = '同城投资 - 2014年',ylim = [0,40000]) f1(2014)[1]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'green',alpha = 0.7,ax = axes[1,1],title = '跨城投资 - 2014年',ylim = [0,3000]) # 2014年 f1(2015)[0]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'blue',alpha = 0.7,ax = axes[2,0],title = '同城投资 - 2015年',ylim = [0,40000]) f1(2015)[1]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'green',alpha = 0.7,ax = axes[2,1],title = '跨城投资 - 2015年',ylim = [0,3000]) # 2015年 f1(2016)[0]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'blue',alpha = 0.7,ax = axes[3,0],title = '同城投资 - 2016年',ylim = [0,40000]) f1(2016)[1]['投资企业对数'].plot(kind = 'bar',grid = True, color = 'green',alpha = 0.7,ax = axes[3,1],title = '跨城投资 - 2016年',ylim = [0,3000]) # 2016年
Sed ac lorem felis. Ut in odio lorem. Quisque magna dui, maximus ut commodo sed, vestibulum ac nibh. Aenean a tortor in sem tempus auctor
December 4, 2020 at 3:12 pm
Sed ac lorem felis. Ut in odio lorem. Quisque magna dui, maximus ut commodo sed, vestibulum ac nibh. Aenean a tortor in sem tempus auctor
December 4, 2020 at 3:12 pm
Donec in ullamcorper quam. Aenean vel nibh eu magna gravida fermentum. Praesent eget nisi pulvinar, sollicitudin eros vitae, tristique odio.
December 4, 2020 at 3:12 pm
我是 s enim interduante quis metus. Duis porta ornare nulla ut bibendum
Rosie
6 minutes ago