数据分析师需要什么技能
1、具有Hive/Pig/Spark等大数据分析工具相关使用经验:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
2、熟练使用SAS、5PSS、R、Excel等相关工具,并具有较好的报告呈现和数据解读能力:其中SAS (Statistical Analysis System)是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。
3、熟悉MySQL等关系型数据库:MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于Oracle旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件。
4、熟悉至少一种脚本语言(Shell,Python等),能独立完成相关的数据处理工作:Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他傥态尬锪语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中,有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。
5、了解数理统计、数据分析及挖掘,熟知常用算法,有数据仓库和建模理论基础或实际经验:数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
6、具备良好的沟通交流能力和文字语言表达能力,较好的逻辑分析能力:具有良好的数据敏感度,能从海量数据提炼核心结果;具备高度的责任心,对数据分析及挖掘有浓厚兴趣;具备良好的团队合作精神,具有项目管理能力。