You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
WangXinmin 8c332ee190 添加作业文件夹 project 3 weeks ago
..
docs 添加作业文件夹 project 3 weeks ago
src 添加作业文件夹 project 3 weeks ago
target 添加作业文件夹 project 3 weeks ago
.DS_Store 添加作业文件夹 project 3 weeks ago
README.md 添加作业文件夹 project 3 weeks ago
animals.txt 添加作业文件夹 project 3 weeks ago
animals_wwf.txt 添加作业文件夹 project 3 weeks ago
pom.xml 添加作业文件夹 project 3 weeks ago
population_chart_china.png 添加作业文件夹 project 3 weeks ago
population_chart_iucn.png 添加作业文件夹 project 3 weeks ago
population_chart_wwf.png 添加作业文件夹 project 3 weeks ago
status_distribution_china.png 添加作业文件夹 project 3 weeks ago
status_distribution_iucn.png 添加作业文件夹 project 3 weeks ago
status_distribution_wwf.png 添加作业文件夹 project 3 weeks ago

README.md

濒危动物信息爬取与可视化项目

项目简介

本项目使用Java实现濒危动物信息的爬取与可视化,通过爬虫从IUCN红色名录网站获取濒危动物数据,并使用JFreeChart库生成数据可视化图表。

项目结构

AnimalCrawler/
├── pom.xml                    # Maven配置文件
├── README.md                  # 项目说明文件
└── src/
    └── main/
        ├── java/
        │   └── com/
        │       └── animal/
        │           ├── crawler/  # 爬虫相关代码
        │           │   ├── AnimalCrawler.java  # 爬虫类
        │           │   └── Main.java          # 主类
        │           ├── model/    # 数据模型
        │           │   └── Animal.java        # 动物模型类
        │           └── visualization/  # 可视化相关代码
        │               └── AnimalVisualization.java  # 可视化类
        └── resources/           # 资源文件

依赖项

  • Jsoup: 用于网页解析
  • Jackson: 用于JSON处理
  • JFreeChart: 用于数据可视化
  • Apache Commons CSV: 用于CSV文件处理

运行方法

  1. 安装Maven

  2. 构建项目

    mvn clean package
    
  3. 运行项目

    java -jar target/AnimalCrawler-1.0-SNAPSHOT.jar
    

功能说明

  1. 数据爬取:从IUCN红色名录网站爬取濒危动物信息,包括名称、学名、保护状态、栖息地、描述和种群数量。

  2. 数据可视化

    • 保护状态分布饼图:展示不同保护状态的动物数量分布
    • 种群数量柱状图:展示前10种动物的种群数量
  3. 输出结果

    • 控制台输出爬取的动物数据
    • 生成的图表保存为PNG文件

注意事项

  • 爬虫可能会受到网站反爬机制的限制,请合理控制爬取频率
  • 由于IUCN网站结构可能会变化,爬虫代码可能需要定期更新
  • 本项目仅用于学习和研究目的,请勿用于商业用途

示例输出

运行项目后,会在项目根目录生成以下文件:

  • status_distribution.png:保护状态分布饼图
  • population_chart.png:种群数量柱状图

同时,控制台会输出爬取的动物数据详情。