MySQLでCSVファイルに保存されたデータをインポートするには

Posted on 2023-05-16 by クレストボウズ株式会社

MySQLでCSVファイルに保存されたデータをテーブルにインポートする方法です。

前提として、CSVファイル名をsample01.csv、カンマ区切りのフォーマットを持つものとし、テーブル名はtable01とします。
インポート作業のタイミングでtable01は作成済みであるとします。

データベースにログインした後、以下を実行します。

mysql > LOAD DATA LOCAL INFILE 'sample01.csv' INTO TABLE table01 FIELDS TERMINATED BY ',';

1	mysql > LOAD DATA LOCAL INFILE 'sample01.csv' INTO TABLE table01 FIELDS TERMINATED BY ',';

もしカンマを含む文字列(例えば、金額 2,000 や化学物質名 N,N-ジメチルホルムアミドなど)を要素として持ち、その文字列がダブルクォテーション(“)で囲まれている場合は「enclosed by」を使用して「”」が囲み文字であることを指定すればそのまま読み込むことができます。

mysql > LOAD DATA LOCAL INFILE 'sample01.csv' INTO TABLE table01 FIELDS TERMINATED BY ',' enclosed by '"';

1	mysql > LOAD DATA LOCAL INFILE 'sample01.csv' INTO TABLE table01 FIELDS TERMINATED BY ',' enclosed by '"';

LOCAL修飾子が機能するかどうかについては、サーバおよびクライアントの設定に依存するようです。
13.2.7 LOAD DATA ステートメント

レコード毎のINSERT文になるようにmysqldumpでダンプする方法

Posted on 2017-07-03 by クレストボウズ株式会社

先日、WordPressで作成したサイトのサーバ移設作業をしていたのですが、mysqldumpで作成したダンプファイルを移設先サーバのMySQLにロードしようとしたところ、「Got a packet bigger than ‘max_allowed_packet’ bytes」というエラーが出ました。

解決策を調べたところ、MySQLサーバの「max_allowed_packet」という値を変更する方法が見つかったのですが、今回その方法は使えませんでした。mysqldumpで生成したダンプファイルのエラーになった箇所を調べたところ、大きいテーブルのすべてのレコードをひとつの「INSERT INTO」文によって挿入するようになっていたため、この文のサイズが「max_allowed_packet」を超えているのがエラーの原因であることがわかりました。

そこで、mysqldumpでダンプファイルを生成するときに、レコード毎のINSERT文にする方法を調べました。具体的には、

INSERT INTO `table1` VALUES (1,'aaa'),(2,'bbb'),(3,'ccc');

1	INSERT INTO `table1` VALUES (1,'aaa'),(2,'bbb'),(3,'ccc');

のように生成されるのを、

INSERT INTO `table1` VALUES (1,'aaa');
INSERT INTO `table1` VALUES (2,'bbb');
INSERT INTO `table1` VALUES (3,'ccc');

INSERT INTO `table1` VALUES (1,'aaa');

INSERT INTO `table1` VALUES (2,'bbb');

INSERT INTO `table1` VALUES (3,'ccc');

のように生成されるようにする方法です。

その方法ですが、mysqldumpを実行するときに、「--skip-extended-insert」というオプションを付けるだけです。例えば、以下のように実行します。

$ mysqldump -u user1 -p --skip-extended-insert wp_db1 > wp_db1_dump.sql

1	$ mysqldump -u user1 -p --skip-extended-insert wp_db1 > wp_db1_dump.sql

このように生成したダンプファイルの難点は、ロードするのに時間がかかることですが、場面により、適宜使っていこうと思います。

MySQLのTEXT型データで大文字と小文字を区別できるようにするには

Posted on 2016-01-08 by クレストボウズ株式会社

既に使用を開始しているシステムで、TEXT型で定義しているデータの大文字と小文字を区別しなければならなくなりました。その時に調べた内容のまとめです。

まず、非バイナリ文字列とバイナリ文字列の性質の比較です。

文字列の種類	型	文字列検索	大文字/小文字の区別
非バイナリ文字列	CHAR、VARCHAR、TEXT	比較オペランドの照合順序を使用	なし
バイナリ文字列	BINARY、VARBINARY、BLOB	オペランドのバイトの数値を使用	あり

参照：B.5.5.1 文字列検索での大文字/小文字の区別

バイナリ文字列に区分されている型を使用していれば問題なかったのですが、既に使用を開始していたため、TEXT型のまま大文字と小文字を区別できるようにしました。

まず前提として、「exmtable01」という名前のテーブルがあるとします。

mysql> CREATE TABLE exmtable01 (
    -> value TEXT
    -> );

mysql> CREATE TABLE exmtable01 (

-> value TEXT

-> );

exmtable01のテーブル定義情報は以下のようになっています。

mysql> SHOW CREATE TABLE exmtable01;
+------------+-----------------------------------------------------------------------+
| Table      | Create Table                                                          |
+------------+-----------------------------------------------------------------------+
| exmtable01 | CREATE TABLE `exmtable01` (
  `value` text
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+------------+-----------------------------------------------------------------------+

mysql> SHOW CREATE TABLE exmtable01;

+------------+-----------------------------------------------------------------------+

| Table | Create Table |

+------------+-----------------------------------------------------------------------+

| exmtable01 | CREATE TABLE `exmtable01` (

`value` text

) ENGINE=InnoDB DEFAULT CHARSET=utf8 |

+------------+-----------------------------------------------------------------------+

valueフィールドの型を「TEXT BINARY」に変更します。

mysql> ALTER TABLE exmtable01 MODIFY value TEXT BINARY;

1	mysql> ALTER TABLE exmtable01 MODIFY value TEXT BINARY;

そうすると、exmtable01のテーブル定義は以下のように変更されます。

mysql> SHOW CREATE TABLE exmtable01;
+------------+-----------------------------------------------------------------------+
| Table      | Create Table                                                          |
+------------+-----------------------------------------------------------------------+
| exmtable01 | CREATE TABLE `exmtable01` (
  `value` text CHARACTER SET utf8 COLLATE utf8_bin
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+------------+-----------------------------------------------------------------------+

mysql> SHOW CREATE TABLE exmtable01;

+------------+-----------------------------------------------------------------------+

| Table | Create Table |

+------------+-----------------------------------------------------------------------+

| exmtable01 | CREATE TABLE `exmtable01` (

`value` text CHARACTER SET utf8 COLLATE utf8_bin

) ENGINE=InnoDB DEFAULT CHARSET=utf8 |

+------------+-----------------------------------------------------------------------+

以上の変更により、TEXT型でも大文字と小文字を区別することができるようになりました。

また、テーブルを作成する時に「TEXT BINARY」を指定すると同様の定義となります。

mysql> CREATE TABLE exmtable02 (
    -> value TEXT BINARY
    -> );

mysql> CREATE TABLE exmtable02 (

-> value TEXT BINARY

-> );

mysql> SHOW CREATE TABLE exmtable02;
+------------+-----------------------------------------------------------------------+
| Table      | Create Table                                                          |
+------------+-----------------------------------------------------------------------+
| exmtable02 | CREATE TABLE `exmtable02` (
  `value` text CHARACTER SET utf8 COLLATE utf8_bin
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+------------+-----------------------------------------------------------------------+

mysql> SHOW CREATE TABLE exmtable02;

+------------+-----------------------------------------------------------------------+

| Table | Create Table |

+------------+-----------------------------------------------------------------------+

| exmtable02 | CREATE TABLE `exmtable02` (

`value` text CHARACTER SET utf8 COLLATE utf8_bin

) ENGINE=InnoDB DEFAULT CHARSET=utf8 |

+------------+-----------------------------------------------------------------------+

phpMyAdminを使用している場合は、変更したいフィールドを選択し属性を「binary」に指定すれば、同様の変更を行うことができます。

MySQLをインストールする

Posted on 2015-02-03 by クレストボウズ株式会社

Python+MySQLの組み合わせでCGIシステムを作成するために、MySQLとPythonとのインターフェースをインストールします。MySQLの文字コードはutf8とします。

mysql-serverパッケージをインストールする。MySQLのrootユーザのパスワードを設定する。

/etc/mysql/my.cnfを変更し、文字コードを設定する。

[client]
default-character-set=utf8
[mysqld]
skip-character-set-client-handshake
character-set-server = utf8
collation-server = utf8_general_ci
init-connect = SET NAMES utf8

[client]

default-character-set=utf8

[mysqld]

skip-character-set-client-handshake

character-set-server = utf8

collation-server = utf8_general_ci

init-connect = SET NAMES utf8

PythonとMySQLのインターフェース関連のpython-mysqldbパッケージをインストールする。Pythonで、import MySQLdbが実行できれば準備完了です。

MySQLのテーブルを作成するまでの基本操作まとめ

Posted on 2015-02-03 by クレストボウズ株式会社

MySQLをインストール後、テーブルを作成するまでに行なう基本操作のまとめです。
例として、下記の内容でデータベースおよびテーブルを作成するとします。

データベース名	exmdb
ユーザ名	exmuser
ユーザ：exmuserのパスワード	exmDbPassword
テーブル	exmtable
テーブルの作成等を記述したファイル名	init.sql

rootでmysqlを実行

$ mysql -u root -p Enter password: (rootパスワードを入力)

1
2

$ mysql -u root -p
Enter password: (rootパスワードを入力)
データベースを作成(文字コードをutf8に指定)

mysql > CREATE DATABASE exmdb DEFAULT CHARACTER SET utf8;

1

mysql > CREATE DATABASE exmdb DEFAULT CHARACTER SET utf8;
作成したデータベースを確認

mysql > SHOW CREATE DATABASE exmdb;

1

mysql > SHOW CREATE DATABASE exmdb;
データベースの一覧表示

mysql > SHOW DATABASES;

1

mysql > SHOW DATABASES;
データベースを削除

mysql > DROP DATABASE exmdb;

1

mysql > DROP DATABASE exmdb;
ユーザを作成

mysql > GRANT ALL PRIVILEGES ON exmdb.* TO 'exmuser'@'localhost' IDENTIFIED BY 'exmDbPassword'; mysql > FLUSH PRIVILEGES;

1
2

mysql > GRANT ALL PRIVILEGES ON exmdb.* TO 'exmuser'@'localhost' IDENTIFIED BY 'exmDbPassword';
mysql > FLUSH PRIVILEGES;
ユーザの一覧表示

mysql > SELECT Host, User, Password FROM mysql.user;

1

mysql > SELECT Host, User, Password FROM mysql.user;
ユーザを削除

mysql > DELETE FROM mysql.user WHERE user='exmuser';

1

mysql > DELETE FROM mysql.user WHERE user='exmuser';
作成したデータベースに作成したユーザを指定して接続

$ mysql -u exmuser -p exmdb; Enter password: (ユーザを作成する時に設定したパスワード:exmDbPassword を入力)

1
2

$ mysql -u exmuser -p exmdb;
Enter password: (ユーザを作成する時に設定したパスワード:exmDbPassword を入力)

テーブルを作成

mysql > CREATE TABLE exmtable(
        -> id INT NOT NULL PRIMARY KEY AUTO_INCREMENT,
        -> name TEXT,
        -> value double precision DEFAULT 0.0
        -> );

mysql > CREATE TABLE exmtable(

-> id INT NOT NULL PRIMARY KEY AUTO_INCREMENT,

-> name TEXT,

-> value double precision DEFAULT 0.0

-> );

テーブルの一覧表示

mysql > SHOW TABLES;

1

mysql > SHOW TABLES;
ファイルを読み込み、テーブル、インデックス等を作成

$ mysql -u exmuser -p exmuser < init.sql

1

$ mysql -u exmuser -p exmuser < init.sql

MySQLのload data infile文で文字化けする場合の対策

Posted on 2014-09-30 by クレストボウズ株式会社

システムおよびデータベースの文字コードはすべて utf-8 を使用する前提とします。

既存のシステムからデータを移行するために「load data infile」文を使用すると、読み込んだデータが文字化けしてしまう場合があります。

原因は、「character_set_database」が utf-8 に設定されていないためです。
「load data infile」文は「character_set_database」の設定に従います。

「character_set_database」の設定を確認します。

$ mysql> show variables like 'character%';
+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | latin1                     |
| character_set_connection | latin1                     |
| character_set_database   | latin1                     |
| character_set_filesystem | binary                     |
| character_set_results    | latin1                     |
| character_set_server     | latin1                     |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)

$ mysql> show variables like 'character%';

+--------------------------+----------------------------+

| Variable_name | Value |

+--------------------------+----------------------------+

| character_set_client | latin1 |

| character_set_connection | latin1 |

| character_set_database | latin1 |

| character_set_filesystem | binary |

| character_set_results | latin1 |

| character_set_server | latin1 |

| character_set_system | utf8 |

| character_sets_dir | /usr/share/mysql/charsets/ |

+--------------------------+----------------------------+

8 rows in set (0.00 sec)

以上のように出力された場合、「character_set_database」の設定は「latin1」となっているため、「utf8」に変更します。

$ mysql> set character_set_database = utf8;

1	$ mysql> set character_set_database = utf8;

もう一度「character_set_database」の設定を確認します。

mysql> show variables like 'character%';
+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | latin1                     |
| character_set_connection | latin1                     |
| character_set_database   | utf8                       |
| character_set_filesystem | binary                     |
| character_set_results    | latin1                     |
| character_set_server     | latin1                     |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)

mysql> show variables like 'character%';

+--------------------------+----------------------------+

| Variable_name | Value |

+--------------------------+----------------------------+

| character_set_client | latin1 |

| character_set_connection | latin1 |

| character_set_database | utf8 |

| character_set_filesystem | binary |

| character_set_results | latin1 |

| character_set_server | latin1 |

| character_set_system | utf8 |

| character_sets_dir | /usr/share/mysql/charsets/ |

+--------------------------+----------------------------+

8 rows in set (0.00 sec)

「character_set_database」が「utf8」に変更されたため、文字化けを回避できます。

MySQLでtext型の列にインデックスを作成する

Posted on 2014-08-19 by クレストボウズ株式会社

MySQLでtext型の列にインデックスを作成する場合、サイズを指定する必要があります。

例えば、以下の内容のテーブルを作成します。

$ CREATE TABLE table01 ( id int not null primary key auto_increment, name text );

1	$ CREATE TABLE table01 ( id int not null primary key auto_increment, name text );

サイズの指定をせずにインデックスを作成するとエラーになります。

mysql> CREATE INDEX index_name ON table01(name);
ERROR 1170 (42000): BLOB/TEXT column 'name' used in key specification without a key length

1 2	mysql> CREATE INDEX index_name ON table01(name); ERROR 1170 (42000): BLOB/TEXT column 'name' used in key specification without a key length

そこでサイズを指定します。
以下の指定では、name列の最初の100文字を使用したインデックスが作成されます。

mysql> CREATE INDEX index_name ON table01(name(100));

1	mysql> CREATE INDEX index_name ON table01(name(100));

データをダンプ、リストアするには（02）

Posted on 2014-07-25 by クレストボウズ株式会社

最高気温予想36度、今日も伊勢崎は暑いです。
ここ数日は、暑さ＋WordPressと戦っております。

以前、データをダンプ、リストアするには（01）を書きました。

その時は、ホスティングサービス上にデータをリストアしなければならなかったのですが、どうしてもダンプファイルをそのまま読み込むことができず、苦肉の策としてダンプファイルからINSERT文だけ取り出して何とかリストアしました。

かなりの力技だと思います…。
作業はなるべくスマートに行ないたいものです。

それでは本題です。

ダンプデータをリストアしようとすると以下のエラーが発生。

$mysql --default-character-set=utf8 -u （ユーザ名） -p （データベース名） < out.dump
Enter password:
ERROR 1045 (28000): Access denied for user '（ユーザ名）'@'localhost' (using password: YES)

$mysql --default-character-set=utf8 -u （ユーザ名） -p （データベース名） < out.dump

Enter password:

ERROR 1045 (28000): Access denied for user '（ユーザ名）'@'localhost' (using password: YES)

エラーの原因としては、ホスティングサービスで「LOCK」「UNLOCK」ができないことでした。

以前の記事で書いたように、以下を実行してダンプファイルを作成した場合、作成されたファイル中に「LOCK」「UNLOCK」が含まれます。

$ mysqldump –single-transaction -u (ユーザ名) -p (データベース名) > out.dump

1	$ mysqldump –single-transaction -u (ユーザ名) -p (データベース名) > out.dump

この場合は、作成したダンプファイルの「LOCK」「UNLOCK」をコメントアウトしてからリストアするとエラーになりません。

また、オプション「–skip-add-locks」を追加すると、「LOCK」「UNLOCK」を含まずダンプファイルを作成することができます。

$ mysqldump --single-transaction --skip-add-locks -u (ユーザ名) -p (データベース名) > out.dump

1	$ mysqldump --single-transaction --skip-add-locks -u (ユーザ名) -p (データベース名) > out.dump

こちらの方法であれば、作成したダンプファイルの修正も必要なく、修正によるミスも減らせますね。

PostgreSQL（EUC_JP）からMySQL（UTF-8）へのデータ移行

Posted on 2014-07-10 by クレストボウズ株式会社

localeがUTF-8の環境でEUC_JPのデータベースを作成するの続きです。

テーブル数がそれほど多くない環境での作業です。
もっと良い方法があったらぜひ教えてください。

それぞれの環境は以下の通りです。
【旧システム】 PostgreSQL、EUC_JP（locale、データベースの文字コードとも）
【新システム】 MySQL、UTF-8（locale、データベースの文字コードとも）

まず、【旧システム】での作業です。

テーブル毎にcsvファイルを作成します。例として、テーブル名をcrestboz、csvファイル名をcrestboz.csvとします。

$ psql -U (ユーザ名) (データベース名) -c "SELECT * FROM crestboz" -A -F, > crestboz.csv

1

$ psql -U (ユーザ名) (データベース名) -c "SELECT * FROM crestboz" -A -F, > crestboz.csv

この時点で、crestboz.csvの文字コードはEUC_JPです。
作成したcrestboz.csvから、先頭のカラム名が記述された行と最後尾の行数が記述された行を削除します。
ファイルの文字コードをUTF-8に変換します。

$ nkf -w crestboz.csv > crestboz.utf8.csv

1

$ nkf -w crestboz.csv > crestboz.utf8.csv

次に、【新システム】での作業です。

データのインポート対象のテーブルが既存の場合はDELETEします。
（＊テーブルをDROPして作成し直すと、ID値がリセットされます。）

csvファイルをインポートします。

$ mysql --local_infile=1 -u (ユーザ名) -p (データベース名)
mysql> load data local infile 'crestboz.utf8.csv' into table crestboz fields terminated by ',';

1 2	$ mysql --local_infile=1 -u (ユーザ名) -p (データベース名) mysql> load data local infile 'crestboz.utf8.csv' into table crestboz fields terminated by ',';

関連記事：load data infile文で文字化けする場合の対策

以上の作業を、データを移行するすべてのテーブルについて実行します。

データをダンプ、リストアするには（01）

Posted on 2014-06-17 by クレストボウズ株式会社

ここ10年ほど、データベースは PostgreSQLを使ってきました。
使用するサーバの関係で、今年から MySQLを使っています。

まだまだ不慣れなため、勉強したことを少しずつ書いていきたいと思います。

＊データをダンプ

データベース全体を保存

$ mysqldump --single-transaction -u (ユーザ名) -p (データベース名) > out.dump

1

$ mysqldump --single-transaction -u (ユーザ名) -p (データベース名) > out.dump
テーブルを指定して保存

$ mysqldump --single-transaction -u (ユーザ名) -p -t (データベース名) (テーブル名) > out.dump

1

$ mysqldump --single-transaction -u (ユーザ名) -p -t (データベース名) (テーブル名) > out.dump

＊ダンプデータをリストア

$ mysql --default-character-set=utf8 -u (ユーザ名) -p (データベース名) < out.dump

1	$ mysql --default-character-set=utf8 -u (ユーザ名) -p (データベース名) < out.dump

＊いろいろ試したこと

ダンプ時に指定したオプション(--single-transaction)について
オプションなしで実行したところ、エラーが発生。

$ mysqldump -u (ユーザ名) -p (データベース名) > out.dump

mysqldump: Got error: 1044: Access denied for user (ユーザ名)@'localhost' to database (データベース名) when using LOCK TABLES

$ mysqldump -u (ユーザ名) -p (データベース名) > out.dump

mysqldump: Got error: 1044: Access denied for user (ユーザ名)@'localhost' to database (データベース名) when using LOCK TABLES

【原因】テーブルロック権限(LOCK TABLES)がないため。
【回避方法】オプション --single-transaction の指定。

リストア時の文字コード指定(--default-character-set=utf8 -u)について
オプションなしで実行したところ、エラーが発生。

$ mysql --default-character-set=utf8 -u (ユーザ名) -p (データベース名) < out.dump

ERROR 1044 (42000) at line 38: Access denied for user (ユーザ名)@'localhost' to database (データベース名)

$ mysql --default-character-set=utf8 -u (ユーザ名) -p (データベース名) < out.dump

ERROR 1044 (42000) at line 38: Access denied for user (ユーザ名)@'localhost' to database (データベース名)

クレストボウズ::技術者ブログ

IT関連の技術的なことに関して調査したことなどを公開するブログです

MySQL

MySQLでCSVファイルに保存されたデータをインポートするには

レコード毎のINSERT文になるようにmysqldumpでダンプする方法

MySQLのTEXT型データで大文字と小文字を区別できるようにするには

MySQLをインストールする

MySQLのテーブルを作成するまでの基本操作まとめ

MySQLのload data infile文で文字化けする場合の対策

MySQLでtext型の列にインデックスを作成する

データをダンプ、リストアするには（02）

PostgreSQL（EUC_JP）からMySQL（UTF-8）へのデータ移行

データをダンプ、リストアするには（01）