二十一、XML


二十一、XML


21.1 XML介绍


21.1.1 一个问题引入 XML

思考:前面的反射可以加载配置文件里的信息,获取类的字节码对象从而动态创建对象和调用方法,但是如果需要创建多个不同类的对象调用不同的方法怎么办?

以前的方法:

//用properties做配置文件
className=com.heima.homework.DemoClass,com.heima.homework.Student,....

问题:如果配置文件的信息较多,properties 的方法不方便

解决:引入XML 做配置文件

21.1.2 XML介绍【理解】

  • xml概述
    XML 的全称为( EXtensible Markup Language ),是一种可扩展的标记语言
    标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
    可扩展:标签的名字是可以自定义的, XML 文件是由很多标签组成的,而标签名是可以自定义的
  • 作用
    • 用于进行存储数据和传输数据
    • 作为软件的配置文件
  • 作为配置文件的优势
    • 可读性好
    • 可维护性高

21.2 XML使用语法


21.2.1 XML标签的规则【应用】

  • 标签由一对尖括号和合法标识符组成

  • 标签必须成对出现
 
前边的是开始标签,后边的是结束标签
  • 特殊的标签可以不成对,但是必须有结束标记
  • 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来
 
  • 标签需要正确的嵌套
这是正确的:  张三 
这是错误的: 张三

21.2.2 语法规则【应用】

  • 语法规则
    • XML文件的后缀名为:xml
    • 文档声明必须是第一行第一列
      • <?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
      • version :版本,该属性是必须存在的
      • encoding :打开当前 xml 文件的时候应该是使用什么字符编码表(一般取值都是 UTF-8 ),该属性不是必须的
      • standalone : 该属性不是必须的,描述 XML 文件是否依赖其他的xml文件,取值为 yes/no
    • 必须存在一个根标签,有且只能有一个
    • XML文件中可以定义注释信息
    • XML文件中可以存在以下特殊字符
< < 小于
> > 大于
& & 和号
' ' 单引号
" " 引号
  • XML文件中可以存在 CDATA 区:
  • 示例代码
<?xml version="1.0" encoding="UTF-8" ?>




    
    
        张三
        23
        学生< >>>>>>>>>>>的信息
         >>>>> ]]]>
    

    
    
        李四
        24
        
    


21.2.3 XML解析【应用】

  • 概述
    xml 解析就是从 xml 中获取到数据
  • 常见的解析思想
    DOM(Document Object Model) 文档对象模型:就是把文档的各个组成部分看做成对应的对 象。
    会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值

image.png

  • 常见的解析工具
    • JAXP : SUN 公司提供的一套 XML 的解析的 API
    • JDOM : 开源组织提供了一套 XML 的解析的 API-jdom
    • DOM4J : 开源组织提供了一套 XML 的解析的 API-dom4j ,全称:Dom For Java
    • pull : 主要应用在 Android 手机端解析 XML
    • XPathpython 使用居多,用到再看
  • 解析的准备工作
    1. 我们可以通过网站:https://dom4j.github.io/ 去下载 dom4j
    2. dom4j-1.6.1.zip  解压,找到里面的 dom4j-1.6.1.jar
    3. idea 中当前模块下新建一个 libs 文件夹,将 jar 包复制到文件夹中
    4. 选中 jar 包 -> 右键 -> 选择 add as library 即可
  • 需求
    • 解析提供好的 xml 文件
    • 将解析到的数据封装到学生对象中
    • 并将学生对象存储到 ArrayList 集合中
    • 遍历集合
  • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>




    
    
        张三
        23
    

    
    
        李四
        24
    



// 上边是已经准备好的student.xml文件
public class Student {
    private String id;
    private String name;
    private int age;

    public Student() {
    }

    public Student(String id, String name, int age) {
        this.id = id;
        this.name = name;
        this.age = age;
    }

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "id='" + id + '\'' +
                ", name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
}

/**
 * 利用dom4j解析xml文件
 */
public class XmlParse {
    public static void main(String[] args) throws DocumentException {
        //1.获取一个解析器对象
        SAXReader saxReader = new SAXReader();
        //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
        Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
        //3.获取到根标签
        Element rootElement = document.getRootElement();
        //4.通过根标签来获取student标签
        //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
        //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
        //List list = rootElement.elements();
        List studentElements = rootElement.elements("student");
        //System.out.println(list.size());

        //用来装学生对象
        ArrayList list = new ArrayList<>();

        //5.遍历集合,得到每一个student标签
        for (Element element : studentElements) {
            //element依次表示每一个student标签
  
            //获取id这个属性
            Attribute attribute = element.attribute("id");
            //获取id的属性值
            String id = attribute.getValue();

            //获取name标签
            //element("标签名"):获取调用者指定的子标签
            Element nameElement = element.element("name");
            //获取这个标签的标签体内容
            String name = nameElement.getText();

            //获取age标签
            Element ageElement = element.element("age");
            //获取age标签的标签体内容
            String age = ageElement.getText();

//            System.out.println(id);
//            System.out.println(name);
//            System.out.println(age);

            Student s = new Student(id,name,Integer.parseInt(age));
            list.add(s);
        }
        //遍历操作
        for (Student student : list) {
            System.out.println(student);
        }
    }
}

21.3  DTD约束【理解】


21.3.1 DTD约束介绍

  • 什么是约束
    用来限定 xml 文件中可使用的标签以及属性
  • 约束的分类
    • DTD
    • schema

21.3.2 DTD的创建

  • 步骤
    1. 创建一个文件,这个文件的后缀名为 .dtd
    2. xml 文件中使用了哪些元素
      ·  可以定义元素(标签)
    3. 判断元素是简单元素还是复杂元素
      简单元素:没有子元素。
      复杂元素:有子元素的元素;
  • 代码实现
 
 
 
 

#PCDATA : 表示字符串、文本

21.3.3 引入DTD约束

  • 引入DTD约束的三种方法
    • 引入本地 dtd
    • xml 文件内部引入:
    • 引入网络dtd
  • 代码实现
    • 引入本地 DTD 约束






<?xml version="1.0" encoding="UTF-8" ?>



    
        张三
        23
    

  • xml 文件内部引入
<?xml version="1.0" encoding="UTF-8" ?>

        
        
        
        ]>


    
        张三
        23
    


  • 引入网络 dtd
<?xml version="1.0" encoding="UTF-8" ?>



    
        张三
        23
    


21.3.4 DTD语法介绍

定义元素

  • 定义一个元素的格式为:
  • 简单元素:没有子元素
    • EMPTY : 表示标签体为空
    • ANY : 表示标签体可以为空也可以不为空
    • #PCDATA : 表示该元素的内容部分为字符串
  • 复杂元素:有子元素
    • 直接写子元素名称. 多个子元素可以使用","或者"|"隔开;
    • , 表示定义子元素的顺序 ,"|" 表示子元素只能出现任意一个
    • ? 零次或一次, + 一次或多次, * 零次或多次,如果不写则表示出现一次

定义属性:

  • 定义一个属性的格式为:ATTattribute (属性)的缩写
  • 属性的类型:
    • CDATA 类型:普通的字符串
  • 属性的约束:
    • #REQUIRED: 必须的
    • #IMPLIED: 属性不是必需的
    • #FIXED value:属性值是固定的,可选

代码实现

 
 
 
  
 
<?xml version="1.0" encoding="UTF-8" ?>


    
        张三
        23
    

    
        张三
        23
    


21.4 schema约束【理解】


21.4.1 schema和dtd的区别

  1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
  2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
  3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
  4. schema 语法更加的复杂

image.png

21.4.2 编写schema约束

  • 步骤
    1,创建一个文件,这个文件的后缀名为 .xsd
    2,定义文档声明
    3,schema 文件的根标签为:
    4,在 中定义属性:
    xmlns=http://www.w3.org/2001/XMLSchema
    5,在 中定义属性 :
    targetNamespace = 唯一的url地址 ,指定当前这个 schema 文件的名称空间。
    6,在 中定义属性 :
    elementFormDefault="qualified" ,表示当前schema文件是一个质量良好的文件。 7,通过element` 定义元素
    8,判断当前元素是简单元素还是复杂元素
    image.png
  • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>


    
    
        
            
                
                
                    
                        
                            
                            
                            
                        
                    
                
            
        
    
    

21.4.3 引入schema约束

  • 步骤
    1,在根标签上定义属性xmlns="http://www.w3.org/2001/XMLSchema-instance"
    2,通过xmlns引入约束文件的名称空间
    3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间
    格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi
    4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径
    格式为:xsi:schemaLocation = "名称空间url 文件路径“
  • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>


    
        张三
        23
    


21.4.4 schema约束定义属性

  • 代码示例
<?xml version="1.0" encoding="UTF-8" ?>


    
    
        
            
                
                
                    
                        
                            
                            
                            
                        
                        
                        
                        
                    
                    
                
            
        
    
    


<?xml version="1.0" encoding="UTF-8" ?>

    
        张三
        23