yunluo_li
大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。“大数据”概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。大数据有4V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。 
寿险行业数据挖掘应用分析 寿险是保险行业的一个重要分支,具有巨大的市场发展空间,因此,随着寿险市场的开放、外资公司的介入,竞争逐步升级,群雄逐鹿已成定局。如何保持自身的核心竞争力,使自己始终立于不败之地,是每个企业必须面对的问题。信息技术的应用无疑是提高企业竞争力的有效手段之一。寿险信息系统经过了多年的发展,已逐步成熟完善,并积累了相当数量的数据资源,为数据挖掘提供了坚实的基础,而通过数据挖掘发现知识,并用于科学决策越来越普遍受到寿险公司的重视。 数据挖掘 数据挖掘(Data Mining,DM)是指从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程。其表现形式为概念(Concepts)、规则(Rules)、模式(Patterns)等形式。 目前业内已有很多成熟的数据挖掘方法论,为实际应用提供了理想的指导模型。CRISP-DM(Cross-Industry Standard Process for Data Mining)就是公认的、较有影响的方法论之一。CRISP-DM强调,DM不单是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。CRISP-DM将整个挖掘过程分为以下六个阶段:商业理解(Business Understanding),数据理解(Data Understanding),数据准备(Data Preparation),建模(Modeling),评估(Evaluation)和发布(Deployment)。 商业理解就是对企业运作、业务流程和行业背景的了解;数据理解是对现有企业应用系统的了解;数据准备就是从企业大量数据中取出一个与要探索问题相关的样板数据子集。建模是根据对业务问题的理解,在数据准备的基础上,选择一种更为实用的挖掘模型,形成挖掘的结论。评估就是在实际中检验挖掘的结论,如果达到了预期的效果,就可将结论发布。在实际项目中,CRISP-DM模型中的数据理解、数据准备、建模、评估并不是单向运作的,而是一个多次反复、多次调整、不断修订完善的过程。 行业数据挖掘 经过多年的系统运营,寿险公司已积累了相当可观的保单信息、客户信息、交易信息、财务信息等,也出现了超大规模的数据库系统。同时,数据集中为原有业务水平的提升以及新业务的拓展提供了条件,也为数据挖掘提供了丰厚的土壤。 根据CRISP-DM模型,数据挖掘首先应该做的是对业务的理解、寻找数据挖掘的目标和问题。这些问题包括:代理人的甄选、欺诈识别以及市场细分等,其中市场细分对企业制定经营战略具有极高的指导意义,它是关系到企业能否生存与发展、企业市场营销战略制定与实现的首要问题。 针对寿险经营的特点,我们可以从不同的角度对客户群体进行分类归纳,从而形成各种客户分布统计,作为管理人员决策的依据。从寿险产品入手,分析客户对不同险种的偏好程度,指导代理人进行重点推广,是比较容易实现的挖掘思路。由于国内经济发展状况不同,各省差异较大,因此必须限定在一个经济水平相当的区域进行分析数据的采样。同时,市场波动也是必须要考虑的问题,一个模型从建立到废弃有一个生命周期,周期根据模型的适应性和命中率确定,因此模型需要不断修订。 挖掘系统架构 挖掘系统包括规则生成子系统和应用评估子系统两个部分。 规则生成子系统主要完成根据数据仓库提供的保单历史数据,统计并产生相关规律,并输出相关结果。具体包括数据抽取转换、挖掘数据库建立、建模(其中包括了参数设置)、模型评估、结果发布。发布的对象是高层决策者,同时将模型提交给应用评估子系统根据效果每月动态生成新的模型。 应用评估子系统可以理解为生产系统中的挖掘代理程序,根据生成子系统产生的规则按照一定的策略对保单数据进行非类预测。通过系统的任务计划对生产数据产生评估指标。具体包括核心业务系统数据自动转入数据平台、规则实时评估、评估结果动态显示、实际效果评估。规则评估子系统根据规则进行检测。经过一段时间的检测,可利用规则生成子系统重新学习,获得新的规则,不断地更新规则库,直到规则库稳定。 目前比较常用的分析指标有: 险种、交费年期、被保人职业、被保人年收入、被保人年龄段、被保人性别、被保人婚姻状况等。 实践中,可结合实际数据状况,对各要素进行适当的取舍,并做不同程度的概括,以形成较为满意的判定树,产生可解释的结论成果。
当今时代,电脑已经成为人们生活以及公司发展的必需品。现在和未来一切都是电脑,所以现在电脑技术还是很有前途的,只要你的技术过硬,找到一份好工作,获得高额薪水,一切都不是问题。
本文详细介绍了毕业论文选题的具体方法,仅供参考。 17世纪法国著名的思想家笛卡尔曾经说过:“最有价值的知识是关于方法的知识。”要选好毕业论文的题目,只了解选题原则还不够,还需要了解和掌握选题的一些具体方法。 一、尽快确定毕业论文的选题方向 在毕业论文工作布置后,每个人都应遵循选题的基本原则,在较短的时间内把选题的方向确定下来。从毕业论文题目的性质来看,基本上可以分为两大类:一类是社会主义现代化建设实践中提出的理论和实际问题;另一类是专业学科本身发展中存在的基本范畴和基本理论问题。大学生应根据自己的志趣和爱好,尽快从上述两大类中确定一个方向。 二、在初步调查研究的基础上选定毕业论文的具体题目 在选题的方向确定以后,还要经过一定的调查和研究,来进一步确定选题的范围,以至最后选定具体题目。下面介绍两种常见的选题方法。 浏览捕捉法 这种方法就是通过对占有的文献资料快速地、大量地阅读,在比较中来确定题目的方法。浏览,一般是在资料占有达到一定数量时集中一段时间进行,这样便于对资料作集中的比较和鉴别。浏览的目的是在咀嚼消化已有资料的过程中,提出问题,寻找自己的研究课题。这就需要对收集到的材料作一全面的阅读研究,主要的、次要的、不同角度的、不同观点的都应了解,不能看了一些资料,有了一点看法,就到此为止,急于动笔。也不能“先入为主”,以自己头脑中原有的观点或看了第一篇资料后得到的看法去决定取舍。而应冷静地、客观地对所有资料作认真的分析思考。在浩如烟海,内容丰富的资料中吸取营养,反复思考琢磨许多时候之后,必然会有所发现,这是搞科学研究的人时常会碰到的情形。 浏览捕捉法一般可按以下步骤进行: 第一步,广泛地浏览资料。在浏览中要注意勤作笔录,随时记下资料的纲目,记下资料中对自己影响最深刻的观点、论据、论证方法等,记下脑海中涌现的点滴体会。当然,手抄笔录并不等于有言必录,有文必录,而是要做细心的选择,有目的、有重点地摘录,当详则详,当略则略,一些相同的或类似的观点和材料则不必重复摘录,只需记下资料来源及页码就行,以避免浪费时间和精力。 第二步,是将阅读所得到的方方面面的内容,进行分类、排列、组合,从中寻找问题、发现问题,材料可按纲目分类,如分成: 系统介绍有关问题研究发展概况的资料; 对某一个问题研究情况的资料; 对同一问题几种不同观点的资料; 对某一问题研究最新的资料和成果等等。 第三步,将自己在研究中的体会与资料分别加以比较,找出哪些体会在资料中没有或部分没有;哪些体会虽然资料已有,但自己对此有不同看法;哪些体会和资料是基本一致的;哪些体会是在资料基础上的深化和发挥等等。经过几番深思熟虑的思考过程,就容易萌生自己的想法。把这种想法及时捕捉住,再作进一步的思考,选题的目标也就会渐渐明确起来。 追溯验证法 这是一种先有拟想,然后再通过阅读资料加以验证来确定选题的方法。这种选题方法必须先有一定的想法,即根据自己平素的积累,初步确定准备研究的方向、题目或选题范围。但这种想法是否真正可行,心中没有太大的把握,故还需按着拟想的研究方向,跟踪追溯。追溯可从以下几方面考虑: ①看自己的“拟想”是否对别人的观点有补充作用,自己的“拟想”别人没有论及或者论及得较少。如果得到肯定的答复,再具体分析一下主客观条件,只要通过努力,能够对这一题目作出比较圆满的回答,则可以把“拟想”确定下来,作为毕业论文的题目。 ②如果自己的“拟想”虽然别人还没有谈到,但自己尚缺乏足够的理由来加以论证,考虑到写作时间的限制,那就应该中止,再作重新构思。 ②看“拟想”是否与别人重复。如果自己的想法与别人完全一样,就应马上改变“拟想”,再作考虑;如果自己的想法只是部分的与别人的研究成果重复,就应再缩小范围,在非重复方面深入研究。 ④要善于捕捉一闪之念,抓住不放,深入研究。在阅读文献资料或调查研究中,有时会突然产生一些思想火花,尽管这种想法很简单、很朦胧,也未成型,但干万不可轻易放弃。因为这种思想火花往往是在对某一问题作了大量研究之后的理性升华,如果能及时捕捉,并顺势追溯下去,最终形成自己的观点,这是很有价值的。 这种主观的“拟想”绝不是“凭空想象”,必须以客观事实、客观需要等作为依据。追溯验证的选题方法,是以主观的“拟想”为出发点,沿着一定方向对已有研究成果步步紧跟,一追到底,从中获得“一己之见”的方法。