博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《数据科学:R语言实现》——3.3 转换数据类型
阅读量:6252 次
发布时间:2019-06-22

本文共 1039 字,大约阅读时间需要 3 分钟。

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.3节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.3 转换数据类型

如果我们在数据导入阶段不指定数据类型,R会自动地给导入的数据集分配一个数据类型。但是,如果分配的数据类型和事实不符,我们可能会在后续的数据操作中遇到困难。因此数据类型转换是预处理阶段的基础性任务。

准备工作
完成之前的教程,导入employees.csv和salaries.csv给R进程。你必须给两个数据集指定了列名,以便执行下面的步骤。
实现步骤
执行下列步骤,转换数据类型。
1.首先,使用函数class查看每个属性的数据类型:
screenshot
screenshot

运行原理

在本教程中,我们展示了如何对数据集中的每个属性进行数据类型转换。在进行转换之前,你必须首先查看每个属性的当前类型。为了确认数据类型,你可以使用函数class进行属性的类别判断。进一步,你可以使用函数str查看所有数据类型。
通过将函数str应用到employees数据框的输出,我们可以看到birth_date和hire_date都是因子类型的。但是,如果想通过birth_date属性计算一个人的年龄,就需要把它转换成日期格式。所以,我们使用函数as.Date把birth_date和hire_date都转换成日期格式。
而且,因子类型限制了属性在取值上的选择,我们并不能自由地给数据集添加记录。由于从数据集中准确地找到相同的姓和名并不容易,我们需要把last_name和first_name转换成字符类型。然后,在下一篇教程中,我们可以继续给数据集employees添加新的记录。最后,我们也应该把salaries数据集中的from_date和to_date转换成日期类型,以便在下一篇教程中进行日期计算。
更多技能
除了使用as函数转换数据类型,你也可以在数据导入阶段指定数据类型。以函数read.csv为例,你可以在colClasses参数中指定数据类型。如果你希望R自动地选择数据类型(即自动把emp_no转换为整型),只需要在colClasses中指明NA:
screenshot

通过指定colClasses参数,emp_no、birth_date、first_name、last_name、gender和hire_date会分别转换成整型、日期类型、字符类型、字符类型、因子类型和日期类型。

转载地址:http://tefsa.baihongyu.com/

你可能感兴趣的文章
centos7 源码安装nginx
查看>>
php 下载word 含图片
查看>>
栈的顺序存储实现
查看>>
编年史:OI算法总结
查看>>
IOS Exception 1(RangeText="[SKTexture]()")
查看>>
IOCP基础封装
查看>>
sass学习
查看>>
javascript基础篇:函数
查看>>
单调队列
查看>>
【原创】C#通用权限管理-程序安全检查,这些你一定要考虑到位
查看>>
Ubuntu完全教程,让你成为Ubuntu高手!
查看>>
vue父子通信的基本使用
查看>>
jquery.cookie 介绍 和 用法
查看>>
[CI] 使用Jenkins自动编译部署web应用
查看>>
SVN与TortoiseSVN实战:补丁详解
查看>>
Centes7 使用 xshell 登陆
查看>>
TestNG源代码分析:依赖管理的实现
查看>>
VMWare 安装时报错 tools-windows.msi failed报错解决办法
查看>>
java一些面试题
查看>>
如何使用dll和lib
查看>>