摘要
针对烟台研究院网站新闻网页文件的特点,以Java语言和开源项目HTMLParser对网页文件进行解析,实现了元数据的自动提取,并给出了关键程序代码。
According to the news files' feature from website of yantai academe, the paper analyzes the Web page files using Java and HTMLParser, and then realizes the automatic extraction. It introduces the implementation procedure and the key program codes.
出处
《电脑与电信》
2008年第4期8-9,共2页
Computer & Telecommunication
基金
中国农业大学烟台研究院科研项目
项目编号:YT200713