抓取篮球球员图片-利用xpath匹配xml

huyumin

浏览: 377870 次
性别:
来自: 深圳

最近访客更多访客>>

一往无前bhz

morelily

loginboot

涓滴之水

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java

package com.hym.io;

import java.io.File;
import java.io.IOException;
import java.net.URL;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.Set;

import org.apache.commons.io.FileUtils;
import org.apache.commons.lang3.StringUtils;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.Node;

public class GetNewBKPlayerPhoto {
	private final static String PLAYER_BET_ID_PATH = "E:\\work\\2014\\basketball\\20140116_photo\\PlayerBetId2.txt";
	private final static String PLAYER_XML_PATH = "E:\\work\\2014\\basketball\\20140116_photo\\LqPlayer_xml.xml";
	private final static String PLAYER_NO_PHOTO_PATH = "E:\\work\\2014\\basketball\\20140116_photo\\noPhoto3.txt";
	private final static String localPath = "E:\\work\\2014\\basketball\\20140116_photo\\bkPlayerPhoto3";

	public static void main(String[] args) {
		System.out.println("downloaded begin ...... ");
		GetNewBKPlayerPhoto getPhoto = new GetNewBKPlayerPhoto();
		List<String> noPhotoList = getPhoto.downLoadPhoto();
		try {
			FileUtils.writeLines(new File(PLAYER_NO_PHOTO_PATH), noPhotoList);
		} catch (IOException e) {
			e.printStackTrace();
		}
		System.out.println("downloaded end ...... ");
	}

	public List<String> getNewPlayerBetId() {
		try {
			//File file = new File(PLAYER_BET_ID_PATH);
			//List<String> betIds = FileUtils.readLines(file);
			List<String> betIds = new ArrayList<String>();
			for (int i = 3791; i<= 4013; i++) {
				betIds.add(String.valueOf(i));
			}
			return betIds;
		} catch (Exception e) {
			e.printStackTrace();
		}

		return null;
	}

	public Map<String, String> getBetIdPhotoMap() {
		List<String> playerBetIdList = getNewPlayerBetId();
		Map<String, String> betIdPhotoMap = new HashMap<String, String>();
		String xml;
		try {
			xml = FileUtils
					.readFileToString(new File(PLAYER_XML_PATH), "utf-8");
			Element root = getRoot(xml);
			for (String betId : playerBetIdList) {
				String photo = getNodeAttribute(root, "i", "Photo", "id", betId);
				betIdPhotoMap.put(betId, photo);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}

		return betIdPhotoMap;
	}

	public List<String> downLoadPhoto() {
		List<String> noPhotoList = new ArrayList<String>();
		Map<String, String> betIdPhotoMap = getBetIdPhotoMap();
		if (betIdPhotoMap != null && !betIdPhotoMap.isEmpty()) {
			Set<String> keySet = betIdPhotoMap.keySet();
			Iterator<String> iter = keySet.iterator();
			while (iter.hasNext()) {
				String betId = iter.next();
				String photo = betIdPhotoMap.get(betId);
				if (StringUtils.isEmpty(photo) || photo.indexOf("no") > -1) {
					noPhotoList.add(betId);
					continue;
				}
				downBKPlayerPhoto(betId, photo);
				System.out.println("downloaded betId = " + betId + ", photo = " + photo);
			}
		}
		return noPhotoList;
	}

	private Element getRoot(String xml) {
		try {
			Document doc = DocumentHelper.parseText(xml);
			Element root = doc.getRootElement();
			return root;
		} catch (DocumentException e) {
			e.printStackTrace();
		}
		return null;
	}

	public String getNodeAttribute(Element root, String nodeName,
			String attrName, String key, String value) {
		List<Node> nodes = root.selectNodes("//" + nodeName + "[" + key + "='"
				+ value + "']");
		if (nodes == null || nodes.isEmpty()) {
			return null;
		}
		return nodes.get(0).valueOf(attrName);
	}

	public void downBKPlayerPhoto(String betId, String photo) {
		String webSite = "http://nba.xxx.com";
		// 一个一个下载照片，并写入本地
		String suffix = photo.substring(photo.lastIndexOf("."));
		URL url;
		try {
			url = new URL(webSite + photo);
			File file = new File(localPath + "\\" + betId + suffix);

			FileUtils.copyURLToFile(url, file);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

分享到：

Spring MVC和Struts2的比较 | mysql 的delete from 子查询限制

2014-01-16 18:55
浏览 830
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

抓取篮球球员图片-利用xpath匹配xml

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

抓取篮球球员图片-利用xpath匹配xml

评论

发表评论

相关推荐

将json格式的字符数组转为List对象

用httpPost对JSON发送和接收的例子

zookeeper适用场景：zookeeper解决了哪些问题

java泛型

Java线程Dump分析工具--jstack

什么是spark？

dubbo 教程

jre/bin目录下面工具说明

JVM系列三:JVM参数设置、分析

jstat使用

查看java堆栈情况（cpu占用过高）

慎用ArrayList的contains方法，使用HashSet的contains方法代替

Java虚拟机工作原理详解

jdk1.5-1.9新特性

java动态代理（JDK和cglib）

Java动态代理机制详解（JDK 和CGLIB，Javassist，ASM）

怎么用github下载资源

maven项目时jar包没有到lib目录下

使用并行计算大幅提升递归算法效率

JAVA 实现FTP

最近访客更多访客>>