本文共 2044 字,大约阅读时间需要 6 分钟。
大数据科学家有多牛?让我们从有史以来市值最高的科技公司苹果看起。为抢大数据科学家,苹果开出美金16万到20万(约合台币400万到600万)的年薪,以及任何你想得到的好福利:美味员工餐、健身中心、教育津贴甚至冻卵补助,但苹果不是唯一一个需要数据科学家的公司,打开领英(LinkedIn)。上面至少有5万3千个数据科学家的职缺,而这还只是美国的统计数字。
美国专业招聘公司罗致恒富(Robert Halt)公布的《2015薪资指南》把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.3%,平均年薪119,250美元至168,250美元,在国内根据经验平均也有100万到500万的薪资行情。
鼎鼎大名的数据科学家你也许听过不少,诸如美国白宫首席数据科学家帕帝亚(DJ Patil)、被选为全美Top 4技术长的宝立明又或者是阿里巴巴集团大数据的第一把交椅车品觉,但这些如雷贯耳的大数据科学家动辄掌管一个个国家或跨国企业的海量数据,彷彿离一般人很遥远。其实,现在各行各业都亟需大数据科学家,你也可以加入大数据淘金潮,但到底什么样的人才适合做大数据的工作呢?想要抢搭大数据人才热潮,晋身高薪一族,又需要注意哪些事情?
就跟绝大数从事电脑工程的人一样,大数据科学家每日需与大量数据为伍;同样是大数据分析,但每个分析师或科学家所专注的领域有所不同。从市场反应决定要做出什么相对应措施,时常与点击率、转化率和流失率等数据为伍。然而不管何种类型的大数据科学家,身上都具备以下5种专业特质:
特质一:定义和厘清问题
好的数据科学家具备什么条件,一般可以分成两种等级:一种是是别人帮你把问题定义好,然后你来解开,但更厉害的是你知道怎么找问题,什么问题才是重要的,自己发现问题。要定义最有前瞻性最重要的问题,结果不只正确还要显著性,对各领域发展有贡献,要有商业价值和技术进步的空间,两者能兼备是最好的。在分析数据时定义问题的能力很重要,因为问题分成很多层面,数据科学家必须要看当下要解决什么问题,再用那个指标去回答。因此数据科学家首要具备的条件就是:定义和厘清问题。
特质二:想像力
不要以为数据科学家整天在电脑前面工作,只要一板一眼地分析数据就好,其实想像力也很重要。有一定的创意才能帮助自己找到不一样的观点,学校会训练你使用习惯的工具,但你应该要尝试各种可能,如果没有专业知识判断,最后得到的结果就会跟大家差不多。
例如一些提供大数据解决方案的公司常会需要帮助客户找到具有某种特征的族群,这个时候若只靠经验和专业是不够的,还需要发挥一些想像力。我们在描述一个人的行为倾向时是很多维度的东西去做整合,除了你对生活经验的丰富度之外,你还要有创意去描述这种人具有什么样的行为特征,我们再透过机器学习的辅助,帮助你快速收集这些特征背后隐含的意义是什么,不然一般人就是我想到什么样的资讯我就勾一勾,这是远远不够的。
特质三:逻辑思考能力
数据科学家的工作时常需要建立假设然后去验证它,并且建立模型,这个过程依赖优秀的逻辑思考能力,否则追寻答案到一半可能不小心就会走到岔路。心理学的训练帮助可以更容易了解他人的动机和想法,也因此在分析数据时常有意想不到的收获。
以大数据科学家最讨厌的机器人为例,这类的假数据抓不胜抓,又会影响到统计结果,令人不堪其扰,然而与其去思考机器人在哪里,要怎么抓,不如反向思考什么样的网页需要机器人,机器人的数据从哪里来,就像是侦探福尔摩斯一样,侦探怎么找出犯人,他不是从犯案手法去看的,而是从动机。
特质四:基础数理与资讯工程能力
大数据科学家不一定非得要是理工学院或电资学院出身的,但还是必须具备基础数理与资讯工程能力。
你也许可以用Excel去处理数据,但如果想要加快资料处理速度的话,程式能力依然是必须的。不害怕数字很重要,必须要培养对数字的敏锐度;在工具之外,最重要的还是商业嗅觉,现在很多人随随便便就说自己会做数据分析会用什么资讯工具,但没有商业眼光依然白搭。
特质五:跨界合作能力
最后,由于大数据科学家必须胆大心细又要天马行空,逻辑好之外还得要融合自身生活经验,这些特质要在一个人身上面面俱到非常困难。跨界合作能力在这里就显得格外重要,因为不同的产业别需要不同的观点,如果不懂得倾听别人的意见,恐怕陷入盲点而不自知,跨界合作有助于发现不同面向切入分析,更有效率地做决策。
“在大数据领域的英雄不是图灵,也不是克劳德·夏农(发明资讯概论的人),而是福尔摩斯;如果只是因为大数据很红就去学习大数据,你学这些也许只能赚22W的,但是如果先掌握这些特质,把专业领域做好,你就可以赚220W。因此,与其盲目追随大数据热潮,不如看看自己是否具备这些特质以及专业,再来决定要不要加入大数据淘金潮。
====================================分割线================================
本文转自d1net(转载)