打印本文 打印本文  关闭窗口 关闭窗口  
大数据精准匹配在生物医药制造业的应用前景
作者:吴政兴  文章来源:火石创造  点击数  更新时间:2018-12-14 11:46:23  文章录入:huangyf81  责任编辑:huangyf81

一、大数据定义及特点

1、大数据的定义:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

2、大数据的特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),即IBM提出的5V特点。

大数据被美国政府认为是“未来的新石油”,被视为等同于人力资源和物质资源的国家重要战略资源。著名的未来学家阿尔文·托夫勒在《第三次浪潮》中语言,社会经济的发展将由农业经济、工业经济进入信息经济和生物经济时代。

提到大数据,必然要提到云计算,大数据与云计算的关系就像一枚硬币的正反面一样密不可分,大数据依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。

大数据的基础是数据大,有海量数据可以进行挖掘,那么对于生物医药B2B尤其是制造业来说,对海量数据的挖掘会带来怎样的改变?那一定是按需进行点对点的精准匹配。

在互联网诞生之前,无论是企业还是个人,最痛苦的是手头掌握的信息太少、信息来源缺乏、信息处理时间缓慢;在商业决策、人才政策等各方面与产业链的互联缺乏数据及时支撑,信息不对称严重制约产业和企业自身发展。

互联网犹如一股春风,瞬间让我们进入了数据大爆炸的时代,短短十几年,数据已经达到无可想象,毫不夸张地说,我们的世界将在 2025 年被数据淹没,这丝毫不令人惊讶,2025年全球大数据量级将达到 163 ZB,比 2016 年创造出的数据量增加10倍,全球数据量产生的第一大主体将由消费者转移到企业,届时企业产生的数据量将占到全球数据总量的 60%。

注意!注重数据价值的时代已经来临,并逐渐取代了从模拟数据向数字化转变的时期;产生、使用和管理对生活产生重要影响的数据信息,对于消费者、政府和企业的正常生活和运转必不可少。消费者和企业将持续在不同设备和云之间产生、分享和访问数据,增长速度也将超出此前的预期。

你是否有这个困惑:当你想买一种设备、或者检索某种知识盲点,去百度搜索的时候,随便输入一个关键字,弹出来几十万上百万的结果,你会不会陷入选择困难?在这么多信息中,如何找到你最匹配的商品或服务?这真实大海捞针,比没数据时代更烦恼了。

二、大数据的来源

大数据时代,人人都是数据源,每时每刻都在产生数据。比如:早上起来刷个朋友圈、出门吃早饭用移动支付、打开导航开车出门避堵、使用App刷刷时政新闻等等。任何个人和企业的被记录行为,都被主动或被动记录在大数据这个池子里。当你走在路上没有使用任何看似与产生数据有关的行为,但是你的行为有可能被路面的摄像头、行车记录仪等实时记录,你就成了这里面大数据的一份子。

对于企业的大数据来源,我们可以概括为三个方向:

核心:即企业数据中心和企业云的数据;

边缘:核心数据中心外的其它企业系统;

终端:PC、手机、传感器、照相机、智能汽车等;

三、生物医药大数据

在生物医药领域, 各种平台的数字化、企业营销PR、无数的数码传感器,时时刻刻都在产生着大量数据。我们已经进入了具备相当深度和广度的生物医学大数据时代。

生物医药行业数据呈现爆炸性增长,包罗信息多、价值大,但存在碎片化、利用率低的问题。为适应生物医药研究进入数据密集型范式的时代需求,生物医药数据要以“整合、交互与先进IT技术”为导向,进行有效挖掘、实现高层次的汇交共享和分析挖掘,从而使医药行业的每个参与方均从中受益。

供给和需求双轮驱动:供给驱动来自于生物医药电子数据的积累、数据挖掘手段的提升和移动互联的普及。随着电子病历、二代测序、互联网医疗、药品网售、云存储等新技术平台的出现,生物医药大数据的积累正在加速。另外,新技术的出现让数据挖掘、大数据分析的手段日益精进。而生物医药产业链各个环节效率的亟待提高、精准医疗技术和市场的成熟、健康管理和慢病管理等需求也加速着生物医药大数据的推进。

前面我们讲了大数据产生之前和之后的两个场景:

数据少的时候,我们需要更多数据来支撑决策,就想方设法做加法,力求得到更多有用的信息;数据大的时候,我们又陷入决策困难,因为在大数据里面,绝大部分数据是无效的,无效的脏数据让我们非常痛苦,这时候必须要做减法。

那么问题来了,如何能够减掉无用的信息、留下有用的信息呢?那就必须对大数据进行挖掘,提取最精准的数据。

数据没有对错,只有多少之分。当你检索一条信息,不管弹出来的是1条信息,还是100万条信息,他们有一个共同的名字叫答案,你要做的是从这些答案中找到最适合你的那一条信息。大数据的最有效应用场景,未来一定是企业行为分析和决策支撑,是B2B,在制造业B2B尤其突出。企业行为的三大要素:参数、性能指标和价格,因为定量因素多,变量因素小,更容易也更适合进行大数据挖掘。

大数据的本质是量化和模型。通过量化的数据和可建立的模型,挖掘出精准的答案。为什么不是B2C或C2C?因为C端用户消费习惯涉及心理、喜好、环境、收入等等的变化因素太多,需求的变化较大、不确定因素太高,挖掘数据背后的行为很难,这也是为什么C端推送的服务经常被吐槽不精准的原因。

制造业及其产业流通方面的要素固定和要求明确方面比较清晰,一个企业的基本需求一般都比较固定,如对地理位置的要求、对品牌的要求、对技术的要求等。一个企业要买一台设备,乃至一个零件,他所有“逛”的时间其实都是他不愿意浪费的,他希望找到的或者被找到的就是那个最准确的卖家。

我们去比较一下C端平台和B端平台的区别就会发现,C端是以“逛”为主,逛着逛着就找到了喜欢的商品,因此C端平台都会注重视觉设计、注重商品的丰富度;反观B端平台的用户,就是采购提出其明确的需求,平台根据需求的产品参数、性能指标,以及平台上卖家的价格、距离、供货期、历史信誉等进行点对点的精准匹配,不需要“逛”的感觉,一定是精准化,不要浪费他的时间。买家只要有一个输入界面,输入自己的明确要求。然后,平台就会将最具性价比的一家或者几家卖家直接推送给买家,买家从中进行谈判采购就可以了。

 

[1] [2]  下一页

打印本文 打印本文  关闭窗口 关闭窗口