소스참조: http://www.ibm.com/developerworks/library/x-tipent.html
xml validation을 하다보면 (builder.parse~~부분)
xml파일이 있는 경로에 dtd이 없거나, 현재 시스템이 사용중인 디렉토리에서 계속 dtd를 읽어들어
dtd파일을 찾을 수 없어 validation을 처리할 수 없는 경우를 종종 경험했다.
예) xml 문서에
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE Message PUBLIC "-//LEE//JIN" "TEST.dtd">
와 같이 되어있다면 /../../../TEST.dtd 지정된 경로에 파일을 찾을 수 없습니다.
EntityResolver을 사용하는 것이다.
EntityResolver를 사용하면 외부의 dtd를 두고 xml을 파싱하여 validation을 체크할 수 있다.
The Parser will call this method before opening any external entity except the top-level document entity (including the external DTD subset, external entities referenced within the DTD, and external entities referenced within the document element): the application may request that the parser resolve the entity itself, that it use an alternative URI, or that it use an entirely different input source.
class DTDResolver implements EntityResolver {
public InputSource resolveEntity(String publicID, String systemID)
throws SAXException {
if (systemID.equals("TEST.dtd")) {
// Return local copy of the copyright.xml file
return new InputSource("/lee/jin/test/TEST.dtd");
// If no match, returning null makes process continue normally
return null;
여기서 pulbicId와 Systemid를 받는데 xml의 doctype을 보면
<!DOCTYPE Message PUBLIC "-//LEE//JIN" "TEST.dtd">
"-//LEE//JIN" 가 publicID, "TEST.dtd"가 SystemID 이다.
그렇기에 xml문서에서 "TEST.dtd"를 만나게 되면 "/lee/jin/test/TEST.dtd"를 리턴하라는 것이다.
즉 어디에 있는 xml을 불러들이건 특정 한 경로에 dtd파일이 있으면 그것을 참조하여 xml을 파싱하기때문에 여러곳에 dtd를 넣고 작업하지 않아도 된다.
(만약 위와같이 했는데도 TEST.dtd를 찾지 못한다면 SystemID.endsWith를 사용하여 처리하면 해결 할 수 있다.)
API참고: http://download.oracle.com/javase/1.4.2/docs/api/org/xml/sax/EntityResolver.html