二十一、XML
二十一、XML
21.1 XML介绍
21.1.1 一个问题引入 XML
思考:前面的反射可以加载配置文件里的信息,获取类的字节码对象从而动态创建对象和调用方法,但是如果需要创建多个不同类的对象调用不同的方法怎么办?
以前的方法:
//用properties做配置文件
className=com.heima.homework.DemoClass,com.heima.homework.Student,....
问题:如果配置文件的信息较多,properties
的方法不方便
解决:引入XML
做配置文件
21.1.2 XML介绍【理解】
- xml概述
XML
的全称为(EXtensible Markup Language
),是一种可扩展的标记语言
标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
可扩展:标签的名字是可以自定义的,XML
文件是由很多标签组成的,而标签名是可以自定义的 - 作用
- 用于进行存储数据和传输数据
- 作为软件的配置文件
- 作为配置文件的优势
- 可读性好
- 可维护性高
21.2 XML使用语法
21.2.1 XML标签的规则【应用】
- 标签由一对尖括号和合法标识符组成
- 标签必须成对出现
前边的是开始标签,后边的是结束标签
- 特殊的标签可以不成对,但是必须有结束标记
- 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来
- 标签需要正确的嵌套
这是正确的: 张三
这是错误的: 张三
21.2.2 语法规则【应用】
- 语法规则
- XML文件的后缀名为:
xml
- 文档声明必须是第一行第一列
<?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
version
:版本,该属性是必须存在的encoding
:打开当前xml
文件的时候应该是使用什么字符编码表(一般取值都是UTF-8
),该属性不是必须的standalone
: 该属性不是必须的,描述XML
文件是否依赖其他的xml文件,取值为yes/no
- 必须存在一个根标签,有且只能有一个
- XML文件中可以定义注释信息
- XML文件中可以存在以下特殊字符
- XML文件的后缀名为:
< < 小于
> > 大于
& & 和号
' ' 单引号
" " 引号
- XML文件中可以存在
CDATA
区: - 示例代码
<?xml version="1.0" encoding="UTF-8" ?>
张三
23
学生< >>>>>>>>>>>的信息
>>>>> ]]]>
李四
24
21.2.3 XML解析【应用】
- 概述
xml
解析就是从xml
中获取到数据 - 常见的解析思想
DOM(Document Object Model)
文档对象模型:就是把文档的各个组成部分看做成对应的对 象。
会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值
- 常见的解析工具
JAXP
:SUN
公司提供的一套XML
的解析的API
JDOM
: 开源组织提供了一套XML
的解析的API-jdom
DOM4J
: 开源组织提供了一套XML
的解析的API-dom4j
,全称:Dom For Java
pull
: 主要应用在Android
手机端解析XML
XPath
:python
使用居多,用到再看
- 解析的准备工作
- 我们可以通过网站:https://dom4j.github.io/ 去下载
dom4j
- 将
dom4j-1.6.1.zip
解压,找到里面的dom4j-1.6.1.jar
- 在
idea
中当前模块下新建一个libs
文件夹,将jar
包复制到文件夹中 - 选中
jar
包 -> 右键 -> 选择add as library
即可
- 我们可以通过网站:https://dom4j.github.io/ 去下载
- 需求
- 解析提供好的
xml
文件 - 将解析到的数据封装到学生对象中
- 并将学生对象存储到
ArrayList
集合中 - 遍历集合
- 解析提供好的
- 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
张三
23
李四
24
// 上边是已经准备好的student.xml文件
public class Student {
private String id;
private String name;
private int age;
public Student() {
}
public Student(String id, String name, int age) {
this.id = id;
this.name = name;
this.age = age;
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "Student{" +
"id='" + id + '\'' +
", name='" + name + '\'' +
", age=" + age +
'}';
}
}
/**
* 利用dom4j解析xml文件
*/
public class XmlParse {
public static void main(String[] args) throws DocumentException {
//1.获取一个解析器对象
SAXReader saxReader = new SAXReader();
//2.利用解析器把xml文件加载到内存中,并返回一个文档对象
Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
//3.获取到根标签
Element rootElement = document.getRootElement();
//4.通过根标签来获取student标签
//elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
//elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
//List list = rootElement.elements();
List studentElements = rootElement.elements("student");
//System.out.println(list.size());
//用来装学生对象
ArrayList list = new ArrayList<>();
//5.遍历集合,得到每一个student标签
for (Element element : studentElements) {
//element依次表示每一个student标签
//获取id这个属性
Attribute attribute = element.attribute("id");
//获取id的属性值
String id = attribute.getValue();
//获取name标签
//element("标签名"):获取调用者指定的子标签
Element nameElement = element.element("name");
//获取这个标签的标签体内容
String name = nameElement.getText();
//获取age标签
Element ageElement = element.element("age");
//获取age标签的标签体内容
String age = ageElement.getText();
// System.out.println(id);
// System.out.println(name);
// System.out.println(age);
Student s = new Student(id,name,Integer.parseInt(age));
list.add(s);
}
//遍历操作
for (Student student : list) {
System.out.println(student);
}
}
}
21.3 DTD约束【理解】
21.3.1 DTD约束介绍
- 什么是约束
用来限定xml
文件中可使用的标签以及属性 - 约束的分类
DTD
schema
21.3.2 DTD的创建
- 步骤
- 创建一个文件,这个文件的后缀名为
.dtd
- 看
xml
文件中使用了哪些元素
·
可以定义元素(标签) - 判断元素是简单元素还是复杂元素
简单元素:没有子元素。
复杂元素:有子元素的元素;
- 创建一个文件,这个文件的后缀名为
- 代码实现
#PCDATA : 表示字符串、文本
21.3.3 引入DTD约束
- 引入DTD约束的三种方法
- 引入本地
dtd
: - 在
xml
文件内部引入: - 引入网络
dtd
:
- 引入本地
- 代码实现
- 引入本地
DTD
约束
- 引入本地
<?xml version="1.0" encoding="UTF-8" ?>
张三
23
- 在
xml
文件内部引入
<?xml version="1.0" encoding="UTF-8" ?>
]>
张三
23
- 引入网络
dtd
<?xml version="1.0" encoding="UTF-8" ?>
张三
23
21.3.4 DTD语法介绍
定义元素 :
- 定义一个元素的格式为:
- 简单元素:没有子元素
EMPTY
: 表示标签体为空ANY
: 表示标签体可以为空也可以不为空#PCDATA
: 表示该元素的内容部分为字符串
- 复杂元素:有子元素
- 直接写子元素名称. 多个子元素可以使用","或者"|"隔开;
,
表示定义子元素的顺序 ,"|"
表示子元素只能出现任意一个?
零次或一次,+
一次或多次,*
零次或多次,如果不写则表示出现一次
定义属性:
- 定义一个属性的格式为:
,
ATT
是attribute
(属性)的缩写 - 属性的类型:
CDATA
类型:普通的字符串
- 属性的约束:
#REQUIRED
: 必须的#IMPLIED
: 属性不是必需的#FIXED value
:属性值是固定的,可选
代码实现
<?xml version="1.0" encoding="UTF-8" ?>
张三
23
张三
23
21.4 schema约束【理解】
21.4.1 schema和dtd的区别
- schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
- 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
- dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
- schema 语法更加的复杂
21.4.2 编写schema约束
- 步骤
1,创建一个文件,这个文件的后缀名为.xsd
。
2,定义文档声明
3,schema
文件的根标签为:
4,在
中定义属性:
xmlns=http://www.w3.org/2001/XMLSchema
5,在
中定义属性 :
targetNamespace = 唯一的url地址
,指定当前这个schema
文件的名称空间。
6,在
中定义属性 :
elementFormDefault="qualified" ,表示当前
schema文件是一个质量良好的文件。 7,通过
element` 定义元素
8,判断当前元素是简单元素还是复杂元素
- 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
21.4.3 引入schema约束
- 步骤
1,在根标签上定义属性xmlns="http://www.w3.org/2001/XMLSchema-instance"
2,通过xmlns引入约束文件的名称空间
3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间
格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi
4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径
格式为:xsi:schemaLocation = "名称空间url 文件路径“ - 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
张三
23
21.4.4 schema约束定义属性
- 代码示例
<?xml version="1.0" encoding="UTF-8" ?>
<?xml version="1.0" encoding="UTF-8" ?>
张三
23