2019年2月11日月曜日

Rstudioでマルチバイト文字を含むcsvファイルを読み込む

Version 1.1.456   Windows 10 pro/64 bit OS/Core i5/16 Gb RAM
かなり手間取ったので
(以前はこんなことなかったと思うのだけど)

やりたいこと

Excel365で集計したデータをcsvに吐き出して,Rに読み込ませたい.
(いまどきExcelファイルを直接読み込ませる?)

トラブった概要

MyData <- read.csv(file="data.csv", fileEncoding = "UTF-8", header=TRUE, sep=",")
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  invalid input found on input connection 'data.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  incomplete final line found by readTableHeader on 'data.csv'

ちなみに,excel fileを含めFile -> Import Datasetでもやってみた(この次点ではできない) filename too longみたいなエラーメッセージをいただいた

解決策


readrというpackageのread_csvを使えばよいらしい
  1. install.packages("readr")
    (dependencyをupdateしなくちゃいけないから再起動する,って言われた)
  2. library(readr)
  3. read_csv(file="data.csv")
File -> Import Datasetでも,read_csvを使って読み込むようになった(なぜ?→readrパッケージが必要だから)