|
|
|
| 中国商业智能的应用特点 |
 |
特邀嘉宾:郑正中:先特计公司大中华区总裁
|
时间:2008年1月16日上午 10:00-11:00
|
| 地点:ERP世界网会议室 |
| 原文网址:http://bbs.erpworld.net/viewthread.php?tid=1174&extra=page%3D1 |
| |
| 主持人: |
刚才说的深蓝是不是在做这个技术? |
| 郑正中: |
深蓝不是在做这个技术。比如说有一台机器,告诉它加法,它就知道所有的数目间的加法。所以后来商业智能就把这个技术应用在数据挖掘里面。在海量的数据当中,数据之间有什么样的关系,寻找数据之间的关系,是数据挖掘最常要做的事情。我们用一个最常用的方法,在整个零售业里面有一个叫菜篮子分析,假设我们去猜测一个人,拿一个菜篮子,他去买东西,他会把哪些东西放在这个菜篮子里。像7-11便利商店,他们经过很多客户购买的数据的分析,可以知道假设今天一个客户,他买了什么样的口味的面包,可能是红豆馅儿的面包,那他最有可能买绿茶口味的饮料。这个就是我们讲的菜篮子、或关联式分析,这也是数据挖掘中最常用到的技术,就是寻找数据之间的关联。 |
| |
还有在银行方面也常用数据挖掘的技术,大家都知道现在银行一个主要的业务就是发行信用卡,但是这有很大的风险。信用卡的持有者,未来可能不按期去还款,甚至干脆不还了。所以银行要怎么知道呢?这里所用的技术就是数据挖掘技术,假设现在它有一百万个信用卡用户,银行透过主要的数据分析,哪一类的信用卡的用户,不会还钱,哪一类的会按时还钱,或者哪一类的根本不还钱。把这一百万的客户的属性,类似年龄,性别,以及银行存款的多少等拿来进行分析和挖掘,最后可以分成上面提到的三大类。所以当今天有新的用户申请信用卡时,他就会拿过来做比对,他是归属于哪一类,这也是数据挖掘里面最常用的另一种技术,叫做分类。数据挖掘最后就是把客户分类,这是我们讲的两种不同的数据挖掘技术。 |
| |
因为数据挖掘技术含量太高了。可能不同的技术都可以给你结果。有的说我用的是人工智能的技术,有的说是用的统计的技术,但是每一种技术都会给你结果。不像刚才的汇总,1+1=2是很明确的。但是说到数据挖掘,你要如何判断哪一个结果是对的。这是数据挖掘在应用上碰到的最大的难点,你无法判断最后给的结果哪一个是适合我的。所以在实施这种数据挖掘的时候,通常需要很多这方面的专家叁与。这不是一般的企业可以有这样的预算来实施,而且需要很长的时间,才可以得到最后它想要的结果。 |
| |
在市场上使用数据挖掘这种技术的企业非常少,大部分使用的还是OLAP的技术。专门做数据挖掘的软件公司也不多,像SAS、SPSS,这些公司的发展都是从统计这个领域开始的,都是做统计软件的。统计技术刚好有很多部分应用在数据挖掘里,后来这些都纷纷转型成数据挖掘的公司。 |
| 主持人: |
我一直也是比较困惑,听起来,这两种技术比较,它是不一样的。根本理论就不一样的。 |
| 郑正中: |
目标都是一样的,就是要挖取这个智能。 |
| 主持人: |
大家可能听的比较又过瘾,可能又比较技术化一点。我们先把这个话题休息一下。我们谈到另外一个话题,谈谈郑总个人的职业经历。 |
| 郑正中: |
回想起一路走来的点点滴滴,还算是很幸运的。我是在台湾长大的,大学毕业后我就出国,刚开始我念计算机。念完书之后先去工作,因为那时候还没有决定是不是要继续念博士学位。大概1987年,我从乔治亚理工毕业。在美国读书每学期修的课是相当多的,在美国读书一年的量大概相当于在台湾读四年。 |
我讲一个自己的故事,因为那时候常常要写作业,写作业要上机,虽然自己带了一台PC机,但是PC机毕竟不够,那时候常要用到大型主机,由于白天用的人多,我自己就只能利用晚上的时间才来做。可能自己的能力也不好,所以要花很多的时间,所以每次都是在晚上的时候。那时候我每天带两个便当,下课了五点多,因为那时候很辛苦,美国的东西很贵,不能天天吃汉堡,所以回家就炒菜做便当。我出国前最常做的事情就是跟妈妈学炒菜,每天都带两个便当,为什么带两个呢?一个是隔天早上吃,另一个是中午吃。晚上凌晨都在上机写作业,上完机之后不回家睡觉,学校图书馆24小时开放,那时候图书馆为了体谅我们这种学生,就是旁边放一些沙发,只要你不要喧哗就可以,所以我上完机之后就在那里睡觉,然后去上课,中午就吃便当。那时在美国求学的话,你平常的个人生活就很少,所以给人压力非常大。那时候很明显的感触就是像上补习班一样,为了考高考。 |
|
| |
|
|
|
|
|