Neo4j入门日志(一)导入数据


本文主要来源于:
neo4j的官方文档
使用的是neo4j官方提供的导入方式,即使用import,在cmd中进行导入。

1.导入的基本方式

bin/neo4j-admin import --database=neo4j --nodes=import/movies.csv --nodes=import/actors.csv --relationships=import/roles.csv

  • 分为node,relationship两类东西。node就是节点,relationship就是两个节点间的连线
  • 都是csv文件导入
  • 节点和关系都可以多个csv存储
  • 在cmd中输入命令import
  • 要导入的文件全复制粘贴在neo4j安装文件夹的import文件夹中

2.分隔符替换

分隔符不是逗号,是分号或者|等符号:可以人为设置
bin/neo4j-admin import --database=neo4j --delimiter=";" --array-delimiter="|" --quote="'" --nodes=import/movies2.csv --nodes=import/actors2.csv --relationships=import/roles2.csv

3.表头文件单独用

  • header files 是说表头,一般是csv文件第一行,表示下面各列都是啥
    csv太大,想修改表头就得打开一个文件,等很久:可以单独使用表头文件,就是把表头文件单独放一个csv,就一行

personId:ID,name,:LABEL

bin/neo4j-admin import --database=neo4j --nodes=import/movies3-header.csv,import/movies3.csv --nodes=import/actors3-header.csv,import/actors3.csv --relationships=import/roles3-header.csv,import/roles3.csv

4.多个输入文件

数据分布在多个csv文件中,可以一次导入,把文件名一个个写上去。

but,如果csv很多,可以用正则表达式,此时导入只要符合规则都导入,但是其顺序有要求。
如果header files是单独的,如3中说,则最好人工放在第一个,然后剩下的文件写正则表达式,如果header files不在第一个import的话就会把表头识别错了。

上面为前4个,较为常用,后面还有6个,暂时用不到。见官方文档