Neo4j入门日志(一)导入数据
本文主要来源于:
neo4j的官方文档
使用的是neo4j官方提供的导入方式,即使用import,在cmd中进行导入。
1.导入的基本方式
bin/neo4j-admin import --database=neo4j --nodes=import/movies.csv --nodes=import/actors.csv --relationships=import/roles.csv
- 分为node,relationship两类东西。node就是节点,relationship就是两个节点间的连线
- 都是csv文件导入
- 节点和关系都可以多个csv存储
- 在cmd中输入命令import
- 要导入的文件全复制粘贴在neo4j安装文件夹的import文件夹中
2.分隔符替换
分隔符不是逗号,是分号或者|等符号:可以人为设置
bin/neo4j-admin import --database=neo4j --delimiter=";" --array-delimiter="|" --quote="'" --nodes=import/movies2.csv --nodes=import/actors2.csv --relationships=import/roles2.csv
3.表头文件单独用
- header files 是说表头,一般是csv文件第一行,表示下面各列都是啥
csv太大,想修改表头就得打开一个文件,等很久:可以单独使用表头文件,就是把表头文件单独放一个csv,就一行
personId:ID,name,:LABEL
bin/neo4j-admin import --database=neo4j --nodes=import/movies3-header.csv,import/movies3.csv --nodes=import/actors3-header.csv,import/actors3.csv --relationships=import/roles3-header.csv,import/roles3.csv
4.多个输入文件
数据分布在多个csv文件中,可以一次导入,把文件名一个个写上去。
but,如果csv很多,可以用正则表达式,此时导入只要符合规则都导入,但是其顺序有要求。
如果header files是单独的,如3中说,则最好人工放在第一个,然后剩下的文件写正则表达式,如果header files不在第一个import的话就会把表头识别错了。
上面为前4个,较为常用,后面还有6个,暂时用不到。见官方文档