• http://www.1927788.com
  • 楼主: 资料狂人
    1237 50

    [学科前沿] R数据挖掘与机器学习1月北京现场班本周日开班 [推广有奖]

    VIP管理员

    泰斗

    58%

    还不是VIP/贵宾

    -

    威望
    9
    论坛币
    986857508 个
    学术水平
    4396 点
    热心指数
    3200 点
    信用等级
    3469 点
    经验
    552434 点
    帖子
    7270
    精华
    143
    在线时间
    11647 小时
    注册时间
    2010-3-18
    最后登录
    2018-1-22

    初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

    楼主
    资料狂人 在职认证  发表于 2018-1-15 07:20:55 |只看作者 |倒序

    R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian

    大数据时代数据分析的必备技能

    ——R数据挖掘与机器学习

    时间2018年1月21-23日 (三天)初级;1月23-25日 (三天)高级

    地点北京市海淀区厂洼街3号丹龙大厦B座三层

    费用

    初级:3300元 / 2800元 (仅限全日制本科生及硕士研究生优惠价)

    高级:3600元 / 3100元 (仅限全日制本科生和硕士研究生优惠价)

    全程:6000元 / 5400元 (仅限全日制本科生和硕士研究生优惠价)

    (食宿自理)

    安排上午9:00-12:00;下午2:00-5:00;答疑

    初级班报名

    高级班报名

    全程班报名


    讲师介绍:
          
    方匡南老师,统计学教授,博士生导师,耶鲁大学博士后。主要研究:数据挖掘、应用统计。       2007年出版了国内第一本R语言中文教程《R语言统计分析软件简明教程》,并于2015年2月出版了《R数据分析:方法与案例详解》,该书在同类书籍中销售名列前茅,并被引入到台湾地区出版。有10多年的R语言使用经验和丰富的数据挖掘和机器学习实战经验。曾先后在在 Journal of Multivariate Analysis、Scientific Reports(Nature子刊)、Computational Statistics and Data Analysis等国内外权威期刊发表论文70多篇。先后主持了国家自然科学基金、国家社科基金等多个项目。
           承担了建行、华为等30个企业数据挖掘项目,有丰富的实战经验。有10年以上的数据挖掘培训经验,长期讲授《数据挖掘》、《机器学习》等课程,讲课生动活泼、深入浅出、以实际案例引出统计方法,再通过编程讲解实际操作和结果分析,先后为50多家企业的技术人员做技术内心,为100多家企业的高管做大数据有关的理念培训。

    课程配套资料:
    (1)提供一份精心准备的非常全面的R软件入门和数据挖掘与机器学习讲义。
    (2)提供课程源代码1份和相应数据若干份。
    特别赠送:方老师主讲的R初级和高级视频,价值1000元!

    R简介:
          R语言由新西兰奥克兰大学ross ihaka和robert gentleman 开发。R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的顶级统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件正成为一种趋势。


    学员对象:

    金融、医疗、通讯、咨询、电子商务等领域的数据分析人员、数据挖掘工程师、数据科学家;

    高校硕士生、博士生、青年教师等。


    培训目的和特色:

    1. 让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
    2. 以实际案例引入,深入浅出地讲解如何使用R语言进行数据挖掘和机器学习,让学员不仅掌握R语言的使用,更重要的是学会数据挖掘和机器学习的思想、原理和方法。
    3. 学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。


    培训内容目录:
    【初级班】

    专题名称

    授课内容

    第1讲(3小时)

    R语言入门


    目标:掌握R语言的基本用法

    1.R语言介绍

    2.编辑软件Rstudio使用

    3.R程序包的载入与使用

    4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)


    2(3小时)

    数据读写

    R基本编程


    目标:掌握用R编写函数和数据的读写

    1. R数据读入与读出

        (读入txt、xls、SPSS、SAS、stata以及数据库文件)

    2.R 函数编写

    3.R的条件与循环函数

    4.高效编程技巧介绍


    3(3小时)

    数据预处理

    探索性分析


    目标:掌握数据预处理与探索性分析

    1.数据预处理

    2.缺失值处理

    3.随机数生成

    4.常用统计方法的蒙特卡洛模拟

    5.随机抽样

    6.单变量数据分析与作图

    7.双变量数据分析与作图

    8.多变量数据分析与作图

    案例1:统计作图在调查数据中的应用

    案例2:统计作图在临床医学中的应用


    43小时)

    数据挖掘与机器学习入门

    线性回归


    目标:数据挖掘与机器学习入门

    1.何为数据挖掘与机器学习

    2.数据挖掘与机器学习的主要研究内容

    3.有监督学习与无监督学习区别

    4.一元线性回归

    5.多元线性回归

    6.逐步回归

    案例1:广告营销计划案例

    案例2:信用卡债务预测案例

    案例3:房价预测案例


    5(3小时)

    线性分类方法


    目标:掌握经典线性分类方法及其应用

    1.Logistic模型

    2.LDA判别分类

    3.QDA判别分类

    案例1:信用卡违约预测案例

    案例2:股价涨跌方向预测案例

    第6讲(3小时)

    重抽样方法

    互动交流讨论


    目标:掌握经典重抽样方法

    1.验证集方法

    2.交叉验证

    3.Bootstrap方法

    案例1:量化投资资产配置案例

    案例2:汽车每加仑汽油里程数预测案例

    互动交流讨论


    【高级班】

    专题名称

    授课内容


    1

    线性分类方法


    目标:掌握经典线性分类方法及其应用

    1.Logistic模型

    2.LDA判别分类

    3.QDA判别分类

    案例1:信用卡违约预测案例

    案例2:股价涨跌方向预测案例


    2(3小时)

    重抽样方法


    目标:掌握经典重抽样方法

    1.验证集方法

    2.交叉验证

    3.Bootstrap方法

    案例1:量化投资资产配置案例

    案例2:汽车每加仑汽油里程数预测案例


    3(3小时)

    决策树

    组合预测


    课程目标:掌握决策树和组合预测方法及其实际应用。

    1.CART决策树

    2.Bagging

    3.随机森林   

    4.Boosting算法

    案例1:棒球运动员薪水预测案例

    案例2:心脏病预测案例

    案例3:信用卡违约预测案例


    4(3小时)

    支持向量机


    课程目标:掌握支持向量机分类方法

    1.最大间隔分类器

    2.支持向量分类器

    3.支持向量机

    案例1:基因表达数据案例

    案例2:股票涨跌方向预测


    5(3小时)

    变量选择与高维数据


    目标:掌握数据挖掘中高维数据分析方法及其实际应用

    1.LASSO

    2.SCAD

    3.MCP

    4.Group  LASSO

    案例1:基因筛选

    案例2: 股票选股

    6(3小时)

    无监督学习

    主成分分析

    主成分回归

    聚类分析

    目标:掌握无监督学习方法及其应用。

    1.主成分分析

    2.主成分回归

    3.Kmeans聚类分析

    4.系统聚类分析

    案例1:广告支出主成分分析

    案例2:犯罪率主成分分析

    案例3:学生考试成绩主成分分析

    案例4:客户细分聚类案例


    优惠:

    现场班老学员9折优惠;
    同一单位三人以上同时报名9折优惠;

    以上优惠不叠加。


    报名流程:
    1:点击“初级班/高级班/全程班报名”,网上填写信息提交;
    2:给予反馈,确认报名信息;
    3:网上订单缴费(需要刷卡或对公转账的请报名后与我们联系);
    4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。

    联系方式:

    魏老师
    QQ:28819897142881989714
    Mail:vip@pinggu.org
    Tel: 010-68478566



    支持楼主:购买VIP购买贵宾 购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
     
    载入中......



    stata SPSS
    沙发
    资料狂人 在职认证  发表于 2018-1-15 07:20:56 |只看作者
    欢迎大家报名参加
    藤椅
    weinamaleny 在职认证  发表于 2018-1-15 07:22:18 |只看作者

    回帖奖励 +2

    方老师的R语言讲授深入简出,每讲都配有案例帮助应用,名师精品现场培训,欢迎参加
    板凳
    资料狂人 在职认证  发表于 2018-1-15 07:23:43 |只看作者
    开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。

    R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。
    报纸
    资料狂人 在职认证  发表于 2018-1-15 07:24:29 |只看作者
    如果你平时的工作会涉及到统计学,那么接触R语言实在是太正常不过了。因为R语言本身为统计而生,所以你能想到的所有统计相关的工作,R都可以非常简洁的用几行命令(甚至1行命令)帮你完成。
    地板
    资料狂人 在职认证  发表于 2018-1-15 07:24:39 |只看作者
    在R官网有这样几句介绍:“R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, …) and graphical techniques, and is highly extensible.  One of R's strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed.”
            * R高度的可扩展性正是体现在它那1万多个包上,你想做的几乎所有事情都可以用现有的R包来辅助完成(当然,有些工作即便能完成但也不适合)。
            * R另一个杀手锏就是其强大的绘图功能,正如上面的英文介绍所言,R可以画图,画各种各样的图,画各种各样高逼格的图,画各种各样高逼格可以直接出版的图。
           * 完善的统计学功能再加上强大的绘图功能,就是你学习的最大理由。
    7
    太史公 发表于 2018-1-15 07:34:56 |只看作者

    回帖奖励 +2

    R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, …) and graphical techniques, and is highly extensible.  One of R's strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed.
    8
    钱学森64 发表于 2018-1-15 07:54:00 |只看作者

    回帖奖励 +2

    谢谢分享
    9
    xujingjun 发表于 2018-1-15 08:33:56 |只看作者

    回帖奖励 +2

    10
    albertwishedu 发表于 2018-1-15 08:38:03 |只看作者

    回帖奖励 +2

    您需要登录后才可以回帖 登录 | 我要注册

    GMT+8, 2018-1-22 13:32
    水富县论坛 商水县论坛 城厢镇论坛 琯头镇论坛 北峰街道论坛
    蓬安县论坛 隆子县论坛 梁山县论坛 砖路论坛 钟楼论坛