大学生认知实习心得体会马上即将迎来在大学的第四个年头,当年大一迈进学校的兴奋还恍如昨日,却止不住岁月的脚步,转眼间我就要踏上社会。犹记得年初的新闻“史上最难就业年”引发关注,我们这群即将面临就业的大学生们的压力可想而知。我到底能做什么?我们专业在就业上面的优势在哪?我们专业如今的现状又是什么样的呢?马克思主义哲学告诉我们,“实践是检验真理的唯一标准”。我在学校里学习到的许多知识,能给这个社会贡献什么,能创造出什么样的价值,这个不是书本能告诉我们的,需要通过我们亲自去体验,去认知,去实践,才能得到答案。怀着很多的疑问,很多的好奇,这个暑假七月,我来到××××有限公司进行我的认知实习。实习内容大概为了解以前做过的一些项目,如金融行业的信用评分、信用卡催收评分;保险电销行业的应用;电信行业应用;商品零售行业应用等等。学生可以结合项目,熟悉数据挖掘的前期数据准备工作,学习数据挖掘工具的运用。若有机会,也可参与正在进行的项目,完成其中的一些工作。由于公司数据挖掘的平台是基于sas,我们需要一定的sas基础和有数据库方面的基础。所以,sasbase软件的使用是最基本的技能,来到这个公司最初我们就被要求对这个软件进行学习。负责我们的陈经理为了帮助我们对这个软件进行学习,给我们出了一道他们过去所实际解决过的问题,不过考虑到商业机密和我们初学的水平,是一个简化版。一同实习的几位同学中间只有我对于sas这个软件有过一定的学习,思索着自己在该门课程上取得了还算不错的成绩,本想自己是不是可以轻松拿下这道题结果却证明我们所学习的理论知识和实际应用果然有一定的差别。我想,大概在学校学习的课程中间,教学计划可能更加侧重于sas这个软件之于我们所学习过的课程上的应用,把我们三年来所学习过的各种分布,算法,模型,在这个软件中得以通过电脑进行快速计算。而在公司里,则更加侧重于实际的应用,我印象中最深的,就是对于时间这个变量的处理,在学校完全不会遇到关于时间变量这样的问题。可是在公司这个变量是最普遍的也是最常用的。这道题的背景是关于电信行业的,在原始数据中,要求我们对所给的交易时间,注册时间,用户编号,交易金额,交易倍数这几个变量进行处理,根据这几个变量看出用户交易时间上集中于每个月的哪几天,每天的那几个时间,根据他给我们的相关定义标记出活跃用户和非活跃用户,第一周,“折磨”了我们一个多星期,大家绞尽脑汁,相互讨论,从一开始编写程序的语法问题,到后来对一个问题有不同的解法,在彼此的磨练中我们学习了sas的知识,也增进了彼此的友情。每一周,负责我们的陈经理都会给我们开会,给我们交流的机会,也是对我们进行指导。第二周快结束的时候,他了解了我们关于这道题的解法,并且从这道题目出发,引申出很多很多相关知识,对数据的关注,不仅仅是去解出题目更多的是去思考为什么。还有数据的敏感度,得到的数据是否合理,若不合理的原因是为什么。如何呈现,不同软件工具的使用,可能不同的软件在不同的部分都各有所长,sas在处理大批量的数据的优势,而ms办公软件在画图上的便捷和美观,在呈现上的直接和明了。还有对于结论的可执行性,不仅仅是得出数据上的结论,更要进一步去沟通过数据,和业务讨论其可以采取的方法来促进利润的扩大。到了第三周,陈经理给我们讲了这个行业如何去操作。来到了这里去了解这个行业之后才发现本来对于这个行业的了解是存在误区的。本以为这个行业的重点在于去制定各种各样的商业模型去分析,但是实际上,在模型前面的数据清洗,数据整理还有数据的调整是需要花大把的时间,一个数据分析的总流程里面,前期对于数据的准备工作是占相对而言较大的时间的每个行业都不一样,所以每一次制定的规则都不一样,每一次都需要和客户公司的业务部门去进行一些规则上面的制定,当出现异常值,缺省值的情况,还需要和客户公司的it部门去作数据上的沟通,了解其中的原因,才能在最终制定策略的时候有所参考,考虑全面细致有所针对。这一点告诉我们,沟通能力很重要。对于已经做出来的数据,需要进行进一步的验证。随着互联技术的逐步发达...