Web Curator Tool – CAT EARS

バグっぽい。

[java title=”org.webcurator.core.store.CrawlLogIndexer抜粋” mark=”10″]
@Override
public void indexFiles(Long harvestResultOid) throws ServiceException {

// sort the crawl.log file to create a sortedcrawl.log file in the same
// directory.
log.info(“Generating ” + sortedLogFileName + ” file for ” + getResult().getTargetInstanceOid());

// create path to log files folder from input directory..
String logPath = directory.getAbsolutePath().substring(0, directory.getAbsolutePath().length()-1);
logPath = logPath + logsSubFolder + “\\”;

// write new ‘stripped’ crawl.log, replacing multiple spaces with a single space in each record..
try {
[/java]

セパレータとしてバックスラッシュを使用しているが、これではWindows環境でしかセパレータとして認識しない。
本来はFile.separator()かFile.separatorChar()で取得すべきである。
これのせいで正常にログ処理ができていないと考えられる。

日	月	火	水	木	金	土
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

[WCT] Windows環境以外で詳細なログが出力されない

収集結果に401ステータスのレコードと200ステータスのレコードが混在する場合、Waybackで401の結果が表示されてしまう