tg-me.com/seedless_channel/1917
Last Update:
最近爬取了一些地方报纸(PDF 文件)。由于报纸网站改版,原始资源无法直接通过网站界面获取。为了防止未来原始资源被删除,计划爬取下来重新整理并分享。
目前想找一个比较方便浏览报纸资源的网站传上去。个人感觉比较用户友好的前端设计是像这种航图网站。左侧树形结构用于导航,右侧在线查看 PDF。可惜该网站不开源。另外自建网站的话还要考虑到静态资源存放的问题(每年报纸资源大小在 3 GB 以上)。
界面上的平替可以用 GitHub Repository。左边有文件树右边有 PDF 预览。不过 Repository 有容量限制。GitHub Release 没容量限制,不过就不方便在线浏览了。
Internet Archive 和 Z-Library 比较适合传电子书资源。目前上面的报纸资源好像不多?而且按月份打包上传会不会有污染搜索结果的嫌疑?Internet Archive 似乎还对版权审查比较严格。
当然要考虑版权的话,对于这种自己不持有版权的资源,最好的方案是自己存着,别往网上发......
BY 无籽水稻种植基地
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
Share with your friend now:
tg-me.com/seedless_channel/1917