- parserのerliestTimestampに未来を指定すれば、12ヶ月分しか表示されなくなる。
Wayback – Administrators Manual
-
earliestTimestampを2030未来を指定してると年始に前月分が表示されない欠点がある。
-
org.archive.wayback.query.RendereのcaptureJspを変更すれば、利用するカレンダーを変更できる。
earliestTimestampを2030未来を指定してると年始に前月分が表示されない欠点がある。
org.archive.wayback.query.RendereのcaptureJspを変更すれば、利用するカレンダーを変更できる。
class=”org.archive.wayback.webapp.AccessPoint”のbeanのnameを”8080″にすればおk。
port80にするなら”80″に。
SourceForge.net: Web Archive Access Utilities: archive-access-discuss
UTC強制でした。。ハードコーディングされてる…JSP弄れば変更できるけども…
StringFormatter (Wayback 1.7.0 API)
Note that date formatting done through this class forces all times to the UTC timezone – at the moment it appears too confusing to attempt to localize times in any other way..
DisclaimChooser.jspのToolbar.jsp読み込みをやめることで対応可能。
仕様のようなのであきらめ。
Wayback – Administrators Manual
Archival URL mode allows replay of all versions captured of a particular URL, by modifying the Timestamp. When an Archival URL Replay request is received for a URL, the Wayback Machine will replay the closest version in time to the Timestamp requested of the particular URL.
WebCuratorToolのProfileにて、Writeする際に401レコードを出力しないよう対応することで回避可能
回避例:
WebCuratorTool > Management > profile > Edit > Writers > org.archive.crawler.writer.ARCWriterProcessor > Archiver#decide-rules
に以下を追加
max-retriesのデフォルトが3な為
で終了してしまう。
4にすれば解決。
Thanks for the details – I think the real culprit is this setting, for a non-intuitive reason:[xml]
3 [/xml]
Indeed, if I lower my max-retries to 3 I can reproduce the problem.So a quick workaround: increase your max-retries to 4. You’ll still be running a bit close to the edge – a momentary problem affecting DNS/robots/URI fetching might still push it over the limit – but in a usual situation you’ll succeed.
Another workaround: any other URI against the same site scheduled first would trigger the DNS and robots tries – so when the authentication-needing URI comes up, it would have all its tries left.
FileStore→LocationDB→ResourceIndexと言った具合にマージされる。
Wayback – Resource Store Configuration
デフォルトではResourceIndexにはBarkleyDB Java Edition(BDB)を利用している。
これを編集するのはやや骨が折れる。
WaybackのAPI(libフォルダ内jar)を利用する事で削除可能。
CloseableIterator
UrlCanonicalizer canonicalizer = new AggressiveUrlCanonicalizer();
SearchResultToBDBRecordAdapter adapter = new SearchResultToBDBRecordAdapter(canonicalizer);
while(itr.hasNext()){
CaptureSearchResult result = itr.next();
BDBRecord r = adapter.adapt(result);
System.out.println(BDBRecordSet.bytesToString(r.getKey().getData()));
rs.delete(BDBRecordSet.bytesToString(r.getKey().getData()));
}
}catch(Throwable t){
t.printStackTrace();
}finally{
rs.shutdownDB();
}
[/java]