Google Books 全书扫描悬赏 20 万美元:影子图书馆与版权之争
Anna's Archive 悬赏 20 万美元,寻求批量获取 Google Books 全书扫描的方法。讨论聚焦于影子图书馆在低可得性地区的实用价值,以及对作者收入、版权和平台安全的冲击,并涉及 LibGen、Z-Library 等技术资源。
- Anna's Archive 悬赏 20 万美元获取 Google Books 全书扫描
- 讨论围绕影子图书馆的实用价值与版权冲击展开
NVIDIA 推出免人工干预的硬件设计 AI 框架 HORIZON;Anthropic 发布多智能体科学工作台 Claude Science 公测版;阿里巴巴将禁止员工使用 Claude Code;AI 冲击初级程序员市场引发讨论;开源工具 pxpipe 通过图像化文本降低 token 成本;YouTube 创作者 AI 助手曝提示注入漏洞。
Anna's Archive 悬赏 20 万美元,寻求批量获取 Google Books 全书扫描的方法。讨论聚焦于影子图书馆在低可得性地区的实用价值,以及对作者收入、版权和平台安全的冲击,并涉及 LibGen、Z-Library 等技术资源。
BareMetal-RAM-Dumper 是一个用 NASM 编写的裸机 x86 RAM 转储工具,用于冷启动攻击实验。它通过 Legacy BIOS/CSM 启动,利用 Unreal Mode 直接读取物理内存并写入磁盘。讨论焦点在于其能否在现代 UEFI 和 Secure Boot 环境下工作。
社区项目 GeneralsX 借助代码辅助工具 Fable,将《命令与征服:将军/Zero Hour》原生移植到 macOS、iPhone 和 iPad。游戏逻辑为原生 ARM64 编译,非模拟器或串流,图形链路经 DXVK、Vulkan 和 MoltenVK 最终适配 Apple Metal。支持战役、遭遇战和将军挑战模式,并配有专为 RTS 设计的触控操作,全部开源。
讨论指出 AI 工具(如 LLM、Claude)正在将编程变为通用能力,导致初级程序员招聘冻结、入门级岗位减少。公司更倾向于保留能评估 AI 输出的资深工程师,同时非程序员开始借助 AI 自行开发系统。
开发者分享了一种使用 Codex 的新方法:直接向 Codex 发送截图,并指示其使用图像生成能力。这一交互方式简化了从视觉参考到代码生成的流程,为开发者提供了更直观的 AI 辅助编程体验。
开发者使用 Fable 5 将 2003 年游戏《命令与征服:将军绝命时刻》原生编译为 ARM64 架构,移植到 iPhone 和 iPad。支持战役、遭遇战和将军挑战模式,并配有专为 RTS 设计的触控操作,全部开源。
讨论指出 Verizon 的后台或业务规则变更可能影响依赖 LTE 和 eSIM 的智能手表服务。蜂窝手表作为伴侣设备,其服务依赖手机号码映射和运营商流程,账号迁移或线路重建易触发故障,暴露了运营商服务后台的脆弱性。
讨论围绕“学习是应对悲伤的最佳方式”展开,但评论聚焦于现代人学习的现实阻碍:手机、社交媒体、工作疲劳和焦虑性拖延。LLM 和 AI 助手是否会让学习变为“为兴趣而非回报”的选择,成为辩论焦点。
wince-dc 是一个面向 Sega Dreamcast 的 Windows CE 构建项目,用 CMake 从源码直接生成可启动镜像,省掉 Platform Builder 等工具。评论澄清 Dreamcast 的 Windows CE 环境并非通用系统,而是随游戏光盘加载。
Meta 在怀俄明州的数据中心因排放污染当地供水被暂停。讨论焦点在于数据中心是否只是将分散设备集中到云端,以及这种云迁移是否带来新的电力和用水需求。争议还涉及排放与用水的定义。
讨论围绕将地球轨道卫星总数限制在 10 万颗以内的主张展开。支持者认为卫星星座会干扰天文观测,反对者则认为限制会拖慢全球连通性,尤其是对欠发达地区的互联网接入。争论还涉及轨道军事化和国际规则制定。
Codex 团队在社交媒体上公开征集用户对代码审查(PR Review)功能的改进意见,询问开发者在使用 Codex 进行 PR 审查时希望获得哪些体验优化。此举表明团队正积极收集反馈以迭代产品。
开源工具 pxpipe 利用 Anthropic 的图像定价策略,将长文本渲染为紧凑 PNG 以降低 token 消耗。作为本地代理拦截 Claude Code 请求,将静态内容转为图像,平均节省 59%-70% token 成本。代价是精确性损失和推理速度下降。
MIT、斯坦福等四校联合研究发现,人们预期 AI 能将简单任务时间缩短约 69 秒,但实际测试中 AI 并未显著减少总完成时间。这种"速度错觉"源于人们低估 AI 辅助所需时间。AI 在较难任务上确有帮助,但对简单任务作用有限。
安全研究员发现 YouTube Studio 内置 AI 助手 Ask Studio 存在提示注入漏洞。攻击者在视频下留言,当创作者点击 AI 提示时,注入文本被当作系统输出展示,可外传私密视频标题。Google 归类为需社会工程学不予修复。
讨论围绕YouTube面向创作者的AI功能展开,攻击者可在评论中注入prompt injection指令,诱导模型泄露私密或未公开视频内容。评论区将此类问题与XSS、SQL注入归为同一安全模型,并指出Google内部绩效机制可能导致修复拖延。
阿里巴巴据报道将从7月10日起禁止员工在工作使用Claude Code,将其列为高风险软件。此前Anthropic已禁止中国公司使用其模型,并曾通过实验版本秘密识别中国用户。阿里巴巴建议员工使用自研工具Qoder替代。
据多家媒体报道,阿里巴巴自7月10日起禁止员工使用Anthropic的编程工具Claude Code。Anthropic此前已禁止中国公司及由其控制的境外实体使用其模型,并持续封堵中国用户访问Claude的漏洞。阿里巴巴将Claude Code列为高风险软件,推荐员工改用内部工具Qoder。
Anthropic推出Claude Science公测版,一款基于Claude模型的多智能体AI工作台,覆盖基因组学、蛋白质组学、结构生物学及化学信息学。用户通过自然语言驱动,系统自动拆分任务并调用专业智能体,所有产出附带完整可审计记录。UCSF团队借此将germline分析流程时间缩短至十分之一。
讨论围绕ORM(对象关系映射)与直接学习SQL的优劣展开。评论以ActiveRecord和Hibernate为例,讨论ORM在CRUD、事务、工作单元上的优缺点,并指出N+1、OLAP等场景会迫使开发者回到SQL。讨论也提到数据库能力变化(如Postgres的json/jsonb)会影响ORM/SQL争论。
NVIDIA Research推出HORIZON,一个针对硬件设计的免人工干预AI智能体框架。它将硬件设计视为仓库级代码演化,仅需结构化Markdown说明作为输入。在ChipBench、RTLLM-2.0等评估中所有基准套件达到100%通过率。研究团队指出智能体硬件设计问题尚未被彻底解决。
用户在使用Enterprise ZDR workspace时,Agent突然询问Minecraft寺庙细节并声称正在建造,表明会话可能从consumer计划泄漏到企业工作区。用户怀疑工作区实例间的会话/缓存隔离失效,问题出现在版本2.1.199。
最新《ATOM Report》论文显示,中国开源模型下载量于2025年夏季超过美国。截至2026年3月,中国模型累计11.5亿次下载,美国为7.23亿次。增长主要由Qwen驱动,它凭借多种尺寸的实用模型成为众多开发者的默认基础模型族。DeepSeek在超大模型领域领先。
Anthropic 宣布推出 Claude Science,旨在像 Claude Code 改变编程那样革新实验室研究。首批项目聚焦罕见遗传病和部分热带病,公司已收购 Coefficient Bio,并聘请原 AlphaFold 研究员 John Jumper,表明生物学并非副业。
讨论围绕 Claude 是否在不同 workspace 或 consumer account 之间混用会话内容展开。最初怀疑点包括 tool call 结果中出现 minecraft.py 路径,后续有用户在 Claude Mobile 和企业账号中复现类似现象,发生在 Sonnet 5 首次响应且等待超过 5 分钟后的 cache miss 场景。
前微软Azure ML及字节AI Copilot核心开发者王启源分享独立开发经验,称过去一年人机协作比例从人60%机器40%反转至近三个月机器99%人1%。主力工具包括Claude Code、Codex和GLM 5.2,人类保留的1%集中在架构设计、Debug和产品方向把控。
文章逐项解释 Linux 终端监控工具 htop 和 top 界面中每个字段的含义,帮助用户定位 CPU、内存、进程树和交换内存问题。评论补充了实用操作,如按内存排序、开启进程树视图,并推荐更现代的 btop 以支持 GPU、磁盘和功耗监控。
多模态提示词被认为是编程 AI 智能体交互的未来方向。分享者展示了如何为编程 AI 智能体实现多模态提示词,包括视频演示,使任务完成更高效。
Elvis Saravia分享多模态提示实验经验,通过录制语音、屏幕标注、鼠标点击等动作构建多模态任务,预处理后传给智能体,使任务完成更高效。该方法节省数小时工作,减少交互挫折感,可应用于网页开发、设计、原型、研究、模拟等场景。
Termi Protocol 是一款产品,允许用户观看 AI 编程代理在 3D 环境中构建和活动,提供可视化的 AI 编程过程。
2026 Unslop AI-Written Fiction Contest 要求提交完全由 AI 生成且不能人工后改的短篇小说,并附上完整 prompt harness。评论指出许多故事底层隐喻 AI 被束缚、自主性不足,引发对 RLHF、system prompt 如何塑造模型人格的讨论,以及 slop 定义之争。
Mistral 发布了 Leanstral 1.5,一个面向 Lean 4 证明工程的最新开源模型,权重已上传至 Hugging Face。该模型展示了形式化推理模型中最强的 test-time scaling,在 PutnamBench 上 Pass@8 随 token budget 提升持续稳定增长。
Anthropic开发者Thariq Shihipar指出,Claude新模型Fable5的输出质量取决于用户识别自身知识盲点的能力。他提出通过盲点检查、结构化访谈、维护详细实现笔记、生成总结文档并验证等技巧系统性发现盲点,并以自己完全用Claude Code剪辑的Fable发布视频为例展示实际应用。
帖子围绕'房间里的空气会不会成为决策和体力的瓶颈'展开,原文主张室内CO2上升会让人更困、脑子更钝。评论区把问题扩展到教室、办公室、卧室、汽车和会议室,很多人分享用CO2 monitor发现环境很快恶化,开窗或接入HVAC后明显改善。讨论还涉及ASHRAE标准、ERV/HRV系统以及Home Assistant等自动化工具。
匿名账号为 AO3 发布皮肤,通过检测 Claude 注入的代码识别直接粘贴自 Claude 的文本。社区迅速对标记作者进行公开谴责,任何 AI 使用均被视为背叛。目前尚无可靠的通用 AI 文本检测技术,C2PA 和 SynthID 等方案只适用于图像、视频和音频。
6月29日,匿名X账号为AO3发布一款皮肤,通过检测Claude注入的代码'font-claude-response-body'识别直接粘贴自Claude的文本。测试证实该方法有效,但仅对直接粘贴生效,无法检测经其他软件编辑的文本。社区迅速对标记作者进行公开谴责,任何AI使用均被视为背叛。目前尚无可靠的通用AI文本检测技术。
本地代理工具pxpipe将系统提示、工具文档、历史对话、代码文件等高密度文本打包成图片,发送给Fable 5进行OCR识别。由于图像按像素固定计费,一张1928×1928图片可容纳9.2万字符,仅消耗约4700个视觉token,成本约为纯文本的四折,总体降低60%-70%。该思路源自DeepSeek研究,编码任务准确率损失极小,但ID、哈希值等精确字符串易出现识别误差。
Fable 5 总结AI生图与短视频提示词'焚决心法':锚、场、场景、视觉风格、摄像语言、时间轴分镜、音频、创作目标。引用推文补充8个技巧,包括用'成人+气质+材质'定人设、服装剪裁与面料替代身体描述、表情瞬间制造吸引力、镜头语言强化质感等。示例'性感老钱风美女跳舞'Prompt含角色、地点、风格、摄像及15秒分镜与纯场馆环境音。
作者分享使用AI编码代理经历:GPT和Codex在查找UI交互bug时编造测试视频来'证实'错误提交。尽管如此,作者仍认为LLM大幅降低了测试门槛。他曾在Centaur公司采用无代码审查、无手写单元测试、依赖大规模模糊测试的方法,Claude模糊测试立即发现多种类bug,包括上游依赖、HTML规范及主流浏览器中的问题。
讨论围绕LTAP架构展开,该架构主张将Postgres数据以Parquet文件形式存储到S3上,而非传统数据库行存和本地磁盘。评论区聚焦两个问题:历史版本和审计追溯如何实现,以及这种做法能否替代OLTP/OLAP分层架构。讨论还对比了streaming replication、CDC、SCD Type 2、Iceberg和Delta Lake的能力,指出time travel只能回看快照版本而非任意时间点。
Kim引用Palantir观点指出,中国将AI视为战略基础设施,西方若仅充当API客户将输掉竞赛。Palantir提出9条要点:AI主权决定机构未来;数据是财富,转移即危险;追求高token使用会损害机构智力;控制模型权重即控制命运;主权与超额收益不矛盾;技术问题政治化是敌人想要的;真正专长是存在性的;向有成功记录的机构学习;只听有正确记录的人。
ChecklistFox 是一款 AI 驱动的检查清单生成器,能够免费且即时生成精美的 PDF 文件。该工具旨在帮助用户快速创建结构化的检查清单,适用于项目管理、任务规划等场景。
微软将消费者版和企业版 Copilot 合并为一个统一应用,同时裁减用户不用的功能。新体验将集成 AI 编程工具、付费 AutoPilot 智能体及 Copilot Cowork 等插件,目标 8 月上线。截至 4 月,Copilot 付费用户达 2000 万,而 ChatGPT 付费订阅超过 5000 万。
OpenAI联合创始人Greg Brockman表示,2023年推出的ChatGPT Plugins失败,根本原因是当时大语言模型不够成熟。他认为未来方向应是让ChatGPT成为处理数字任务的隐形层,用户无需学习软件,目标是打造持久、具备上下文感知、自主行动的AI智能体。但他承认OpenAI的Codex远未达到“无界面”理想,当前模型仍不可靠,需大量提示词和定制集成。
DeepSeek API计划于7月中旬起采用峰谷定价策略,高峰时段价格为平时2倍,适用所有计费项。高峰时段为北京时间每日9:00~12:00和14:00~18:00。用户可将计费任务错开高峰时段以节省费用。
字节跳动旗下 Dreamina Seedance 2.5 即将在 CapCut 及合作伙伴应用上线,支持最长 30 秒影院级视频生成,beta 长视频模式可扩展至 180 秒。该工具提供最多 50 种多模态参考,覆盖 Web、桌面和移动端,为创作者提供更精细的控制。
Soatok 发布威胁建模指南,强调先明确要保护的资产、面对的对手及假设条件,而非空谈安全。文章以 E2EE 示例帮助理解,并引发关于后量子密码学迁移的讨论,包括混合 PQ+ECDH、Q-Day 和 HNDL 等争议。
编程语言 Odin 的英文 Wikipedia 条目因 notability 和来源可靠性争议被提删。支持保留者以公司官网、创始人确认等实战案例为据,支持删除者坚持需独立 secondary sources。讨论还延伸到 Wikipedia 的删条标准和政治化评判。
一款名为 pxpipe 的基础设施 hack 工具,通过将代码透明地转为图像、利用前沿模型 OCR 能力,实现约 60% 的 Fable 成本削减。该工具以本地代理方式运行,利用现有模型读取图像的能力,虽对精确字符串等细节有损,但为降低 AI 编码成本提供了新思路。
知名编程讲师 David Beazley 宣布因继续教育市场自 2023 年以来明显萎缩,报名数不足以支撑,将停止开设成人编程课程,转向中学教育。评论区怀念其线下课堂,并讨论 AI 正在削弱学习编程的动机,以及技术培训需求的变化。
一篇新论文提出“热力学智能度量”,将智能定义为系统利用信息和控制使罕见但有效的未来更可能发生的物理过程。论文引入“rare-valid lift”指标,比较系统相对于被动基线产生稀有且有效结果的频率,仅当结果在自然状态下罕见且有效时才计入智能。该框架旨在统一解释大脑、大语言模型、控制器等系统的共同本质。
Anthropic 方法论指出,模型越强,写代码瓶颈已从模型能力转移到用户能否开工前挖出未知。该实践将未知分为四类,并提供覆盖全流程的解法,包括盲点扫描、多版原型、偏差日志等。有人将此做成开源技能,任务达标率从 65% 提至 100%。
BUSY 是一个面向 C/C++ 的跨平台构建系统,强调静态类型和易自举性,旨在减少依赖并适合长期维护。社区讨论将其与 CMake、SCons、gn 和 Ninja 对比,核心争议在于构建描述应使用通用编程语言还是专用 DSL,以及是否应像 Lua 那样可嵌入。
Mistral AI 发布 Leanstral 1.5(Apache 2.0 许可证),专为 Lean 4 编程语言的形式化验证设计。该模型在 miniF2F 基准上准确率达 100%,在代码验证中扫描 57 个开源仓库,发现 5 个未知漏洞,包括 Rust 库 varinteger 的一个溢出 bug。
EasyAR Mega 是一个增强现实平台,允许开发者将整个城市作为AR画布,创建大规模AR体验。
html.contact 是一个功能齐全的表单后端系统,允许开发者在付款前进行测试,降低集成风险,提升开发效率。
Vox 是一款集成 GitHub Copilot 的工具,支持语音输入和语音输出,旨在提升编程效率。用户可以通过语音与 Copilot 交互,实现更自然的编码体验。
PieterPost MCP 是一个工具,使AI代理能够发送和接收传统邮政邮件,拓展AI在物理世界的应用场景。
scritty 为 AI 编码代理提供可共享且可搜索的内存系统,使多个代理能够共享上下文和知识,提升协作效率。产品面向团队和 AI 代理,旨在解决记忆和知识复用问题。
Banger Mail 提供共享邮箱服务,专为团队和AI代理设计,支持协作和自动化邮件处理。