Search

Travel Tips

Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Lifestyle

Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Hotel Review

Lorem ipsum dolor sit amet, consectetur adipiscing elit.

数据分析与数据化运营

第一章、Python和数据化运营一

第一章、Python和数据化运营

企业的数据化运营是提高利润、降低成本、优化运营效率、最大化企业财务回报的必要课题。 Python 作为数据科学界的关键工具之一,几乎可以应用于所有数据化运营分析和实践的场景。

1.用 Python 做数据化运营


Python 是什么

Python 是一种面向对象的解释型计算机程序设计语言,由荷兰人,Guido van Rossum 于 1989 年发明,第一个公开发行版发行于 1991 年。Python 开发的初衷其实是一个开发程序语言,而非相对数据工作和科学计算的数据处理或建模程序。

为什么我们要选择 Python 而非其他语言(例如 R )进行数据处理、分析和挖掘?

这是因为 Python 先天和后天具有的一些特殊条件和能力使其成为目前企业(尤其是大数据领域)做数据化运营最为合适的工具。

· 开源 / 免费: 使用 Python (及其第三方库)无须购买产品、授权或license 费用,无论对于个人还是对于企业都是如此。

· 可移植性: Python 程序可以跨 Windows 、 Linux 、 Mac 等多平台运行,这点决定了它的移植性非常强,一次开发,多平台应用。

· 丰富的结构化和非结构化数据工作库和工具: Python 除了自带数学计算库外,还包括丰富的第三方库和工具,例如用于连接 Oracle 、MySQL 、 SQLite 等数据库的连接库,数据科学计算库 Numpy 、 Scipy 、Pandas ,文本处理库 NLTK ,机器学习库 Scikit-Learn Theano ,图形视频分析处理和挖掘库 PIL 和 Opencv ,以及开源计算框架 TensorFlow 等。

· 强大的数据获取和集成能力: Python 除了可以支持多种类型的文件(图像、文本、日志、语音、视频等)和数据库集成外,还能通过API 、网络抓取等方式获取外部数据,内、外部数据源整合、多源数据集成、异构数据并存、多类型数据交错正是当前企业数据运营的形

态。

· 海量数据的计算能力和效率: 当面对超过 GB 甚至 TB 规模的海量数据时,传统数据工具通常无法支撑,更不要提计算效率了。 Python 对于这个规模数据的计算能力和工作效率要远超过其他数据工作语言。

· 与其他语言的集成: Python 具备 “ 胶水 ” 能力,能与 Java 、 C 、C++ 、 MATLAB 、 R 等语言集成使用,这意味着你既可以把其他语言写成的脚本嵌入 Python ,也可以把 Python 脚本嵌入其他语言。

· 强大的学习交流和培训资源: Python 已经成为世界上最主流的编程语言和数据处理工作的核心工具之一,有非常多的社区、博客、论坛、培训机构、教育机构提供交流和学习的机会。

· 开发效率高: Python 语言简洁、规范,这使得在使用 Python 开发程序时用时更少。这对于以效率优先的程序工作或验证性项目来说非常关键,效率决定商机。

· 简单易学: Python 语法简单,即使是没有任何代码基础的人也能在几个小时内掌握基本的 Python 编程技巧,这对于初学者而言至关重要,因为这说明对他们来说编程式数据分析不再遥不可及,他们能像使用Excel 一样使用 Python 。

总而言之,在具备一定 Python 经验和技巧的情况下,几乎没有Python 无法胜任的工作场景!如果有,那么用 Python 调用其他语言或用其他语言调用 Python 后,就会胜任。

 2.数据化运营是什么

数据化运营是指通过数据化的工具、技术和方法,对运营过程中的各个环节进行科学分析、引导和应用,从而达到优化运营效果和效率、降低成本、提高效益的目的。运营是一个范围 “ 弹性 ” 非常大的概念,最大可以延伸到所有公司的事务管理,最小可能只包括网站运营管理工作。本书中若无特殊说明,运营的范围包括会员运营、商品运营、流量运营和内容运营四方面内容。

1. 数据化运营的重要意义

数据化运营的核心是运营,所有数据工作都是围绕运营工作链条展开的,逐步强化数据对于运营工作的驱动作用。数据化运营的价值体现在对运营的辅助、提升和优化上,甚至某些运营工作已经逐步数字化、自动化、智能化。

具体来说,数据化运营的意义如下:

1 )提高运营决策效率。在信息瞬息万变的时代,抓住转瞬即逝的机会对企业而言至关重要。决策效率越高意味着可以在更短的时间内做

出决策,从而跟上甚至领先竞争对手。数据化运营可使辅助决策更便捷,使数据智能引发主动决策思考,从而提前预判决策时机并提高决策效率。

2 )提高运营决策正确性。智能化的数据工作方式,可以基于数据科学方法进行数据演练并得出可量化的预期结果,再配合决策层的丰富经验,会提高运营决策的正确性。

3 )优化运营执行过程。数据化运营可以通过标准口径的数据、信息和结论,为运营部门提供标准统一、目标明确的 KPI 管理,结合数据化的工作方法和思路,优化运营过程中的执行环节,从而降低沟通成本、提高工作效率、提升执行效果。

4 )提升投资回报。数据化运营过程中,通过对持续的正确工作目标的树立、最大化工作效率的提升、最优化工作方法的执行能有效降低企业冗余支出,提升单位成本的投资回报。

2. 数据化运营的 2 种方式

从数据发挥作用的角度来看,数据化运营分为辅助决策式数据化运营和数据驱动式数据化运营。

( 1 )辅助决策式数据化运营

辅助决策式数据化运营是运营的决策支持,它是以决策主题为中心的,借助计算机相关技术辅助决策者通过数据、模型、知识等进行业务决策,起到帮助、协助和辅助决策者的目的。例如,通过为决策者提供商品促销销量信息,来为企业促销活动提供有关订货、销售等方面的支持。

( 2 )数据驱动式数据化运营

数据驱动式数据化运营是指整个运营运作流程以最大化结果为目标,以关键数据为触发和优化方式,将运营业务的工作流程、逻辑、技巧封装为特定应用,借助计算机技术并结合企业内部流程和机制形成一体化的数据化工作流程。例如,个性化推荐就是一种数据驱动据化运营方式。

辅助决策式数据化运营和数据驱动式数据化运营是两个层次的数据应用,数据驱动相对于辅助决策的实现难度更高、数据价值体现更大。

· 辅助决策式数据化运营为业务决策方服务,整个过程都由运营人员掌控,数据是辅助角色。

· 数据驱动式数据化运营的过程由数据掌控,数据是主体,实现该过程需要 IT 、自动化系统、算法等支持,数据驱动具有自主导向性、自我驱动性和效果导向性。由于数据和流程本身会存在缺陷,同时运营业务通常都有强制性规则的需求,因此即使在数据驱动数据化运营过程中也会加入人工干预因素。但即使如此,数据作为数据驱动的核心是不变的,也就是说,数据是决策主体本身。

3. 数据化运营的工作流程

介绍了数据化运营的两种方式 —— 辅助决策式数据化运营和数据驱动式数据化运营,其中数据驱动式数据化运营取决于应用场景,不同的场景其工作流程不同。数据驱动式数据化运营工作包含数据和运营两个主体,在实际工作过程中需要二者协同;在某些大型工作项目上,还有可能涉及跟 IT 、信息中心等部门的联动。工作流程分为三个阶段

( 1 )第一阶段:数据需求沟通。

该阶段主要包括需求产生和需求沟通两个步骤。

1 )需求产生:由运营部门产生的某些数据化运营需求,例如预测商品销量、找到异常订单、确定营销目标人群名单等。

2 )需求沟通:针对运营部门提出的需求进行面对面沟通和交流,沟通主要包含三方面:一是业务需求沟通,包括需求产生的背景、要解决的问题、预期达到的效果等;二是数据现状沟通,包括数据存储环境、主要字段、数据字典、数据量、更新频率、数据周期等,如果没有数据则需要制定数据采集规则并开始采集数据,该过程中可能需要 IT 部门的协助;三是数据与分析的关联性沟通,根据与运营人员的沟通,了解业务背景下哪些是常见的、带有业务背景的数据、不同场景会导致数据如何变化、分析中会涉及哪些关键字段或场景数等,业务人员丰富的经验会帮助数据工作者少走很多弯路。

( 2 )第二阶段:数据分析建模。

从这一阶段开始进入正式的数据工作流程,包括数据获取、数据预处理、数据分析建模和数据结论输出四个步骤。

1 )获取数据:数据化运营分析所需的数据需要经过特定授权从数据库或文件中得到。

2 )数据预处理:在该过程中对数据进行质量检验、样本均衡、分类汇总、合并数据集、删除重复项、分区、排序、离散化、标准化、过滤变量、转置、查找转换、脱敏、转换、抽样、异常值和缺失值处理等。

3 )数据分析建模:运用多种数据分析和挖掘方法,对数据进行分析建模。方法包括统计分析、 OLAP 分析、回归、聚类、分类、关联、异常检测、时间序列、协同过滤、主题模型、路径分析、漏斗分析等。

4 )数据结论输出:数据结论的输出有多种方式,常见的方式是数据分析或挖掘建模报告,另外还包括 Excel 统计结果、数据 API 输出、数据结果返回数据库、数据结果直接集成到应用程序中进行自动化运营(例如短信营销)。

( 3 )第三阶段:数据落地应用。

该阶段是数据化运营的落地的关键阶段,前期所有的准备和处理工作都通过该阶段:生价值。该阶段包括数据结论沟通、数据部署应用和后续效果监测和反馈三个步骤。

1 )数据结论沟通:对于输出的形式为报告、 Excel 统计结果等方式的内容,通常都需要与运营对象进行深入沟通,主要沟通的内容是将通过数据得到的结论和结果与业务进行沟通,通过沟通来初步验证结论的正确性、可靠性和可行性,并对结果进行修正。如果没有可行性,那么需要返回第二阶段重新开始数据分析建模流程。

2 )数据部署应用:经过沟通具有可行性的数据结论,可直接应用到运营执行环节。例如,将预测结果作为下一月份的 KPI 目标,将选择出来的用户作为重点客户进行二次营销。

3 )后续效果监测和反馈:大多数的数据化运营分析都不是 “ 一次性 ” 的,尤其当已经进行部署应用之后,需要对之前的数据结论在实践中的效果做二次验证,若有必要则需要进行结论的再次修正和意见反

馈。很多人认为数据化运营工作应该从数据产生之后开始,这是错误的观念,原因在于数据化运营工作的起始是需求产生,而需求的产生跟数据的产生往往没有必然关系。


这是一个简介
    互联网冲浪金牌选手。赖床世锦赛纪录保持者,拖延俱乐部顶级VIP,夜宵外卖一级鉴赏师,国家脱单脱贫重点扶持对象,中央戏精学院优秀学生,亚洲酸柠檬推广大使,国家一级退堂鼓表演艺术家。
评论 (125)
评论

我是 s enim interduante quis metus. Duis porta ornare nulla ut bibendum

Rosie

6 minutes ago

Sed ac lorem felis. Ut in odio lorem. Quisque magna dui, maximus ut commodo sed, vestibulum ac nibh. Aenean a tortor in sem tempus auctor

Agatha Christie

December 4, 2020 at 3:12 pm

Sed ac lorem felis. Ut in odio lorem. Quisque magna dui, maximus ut commodo sed, vestibulum ac nibh. Aenean a tortor in sem tempus auctor

Steven

December 4, 2020 at 3:12 pm

Donec in ullamcorper quam. Aenean vel nibh eu magna gravida fermentum. Praesent eget nisi pulvinar, sollicitudin eros vitae, tristique odio.

Danielle Steel

December 4, 2020 at 3:12 pm