ChatGPT要在输出结果中加入文字水纹,以后没法愉快的抄作业了?

付费频道订阅:

0:00 ChatGPT已经引起很多混乱了,很多人把这东西作为辅助工具,滥用
3:33 所有ChatGPT生成的内容,都应该有一个标记。内容标识的指纹和水纹技术
8:40 盛大文学的防盗版之路给我们带来的提示
11:27 ChatGPT也准备这么干

欢迎加入Discord讨论服务器:


大家好这里是老范讲故事 差的GPT又要整活了 他要干嘛呢 要做文字水印 这事是干嘛用的呢 因为现在叉的GPT被非常多的滥用啊 已经引起了一定的混乱 第一个是要stake overflow 这东西干嘛使呢 这个东西是啊给程序员做呃问答的 就是我遇到了一个什么程序问题 那么他来给你提供解答 现在有大量的人用XCP t生成的答案在 呃stick overflow里边去回复 这么已经给叉 Stick overflow造成了很大的困扰 为什么呢 因为这个差的GPT啊 他答到的答案未必是对的 但是呢他会把语气显得很正确 很有信心的那样的状态 所以啊会把大量的垃圾的 啊不正确的答案发出来 另外的知乎也类似的啊 遇到类似的麻烦 有大量的人用差的GPT生成答案 往知乎里边去填 啊而且很多人呢 把这个东西作为辅助工具来滥用啊 其实我现在也在用啊 特别是一些 啊我们现在做视频写的一些简介啊 包括我要去画封面做的一些 这个提示词

都是用叉的GPT来生成的 但是滥用的有哪些呢 比如说s e o网站 S e o网站是一个什么东西 我们知道谷歌会在很多网站上打广告 哎那么什么样的广啊 网站会被更多的使用呢 就是你在搜索里头能够 排的比较靠前的 所以他们会很多 人会专门做这种叫搜索优化的网站 哎 写大量的文章放在这样的网站上去 那么谷歌经常搜 索的时候会命中到这些网站啊 命中了以后呢 你的网站上的广告就会被得到展示 哎所以专门有一种生意叫s c O网站的生意 原来呢他们会雇人去写哎 现在呢就通通的靠叉的g p t就写了 写完了以后质量还可以 就是你每次给他一个提纲 甚至你写一个中文的提纲 哎说我有一什么事 然后给我写一个这个呃 英文的一个稿件啊 这个他们就直接给你写好 你就可以去贴网站了 剩下的就交给谷歌就完事了 你你就不用管了对吧 他会自然的会命中到你的网站上去 然后自然的 你就有机会来展示你的广告了

他是这样的一种东西 还有些人呢拿他去刷评论啊 就是有很多的评论很多的这个 比如像我的视频啊 你有有时候在里头 就是用机器人自己在下的发评论 这个事都是可以写的很漂亮啊 还有呢就是这个啊各种像什么 呃推特机器人啊 各种各种聊天机器人啊这个全上了 因为叉的GPT 本身就是一个聊天机器人嘛 然后他们现在通过API调用叉的GPT 以后呢 啊或者有一些直接上一些开源的 自己把它部署到本地啊 或者部署到云主机上 就可以生成一些新的这种聊天机器人 啊就出去玩去了 这个事呢还是有一定危害的啊 现在就是你看到叉的c p t回答的问题 你就感觉和这东西比起来 我自己更像个机器人对吧 那个叉的CPT好像还 要更这个一板一有板有眼一点 或者写的更呃 比我写的高几啊会有这样的感觉哎 埃罗马斯克说这周一 12月12号啊 应该是给这个所有推特上的机器人 一个惊喜 实际上他就是要在12月12号 清除推特上的机器人 啊但是呢这个叉的GPT来了

我估计清理的难度会上升 那么有什么办法可以避免这种滥用呢 其实很简单 就是所有叉的g p t生成的内容啊 啊应该有一个标记 就告诉大家说我是叉的g p t生成的 就行了啊 表明一下自己的身份 那么啊 比如说stick overflow 比如说知乎啊 比如说SEO的这种网站 这个 谷歌去搜集的这个网站信息的时候 我们一看啊 这是叉的g p t生成的我就不搜集了 它就是个垃圾信息 对吧那么 如果发现谁经常是用这个插的GPP啊 去写评论去这个啊 像机器人一样去跟人聊天啊 或者像机器人一样去推特里发帖 我们就直接把他删掉就完事了啊 这个呢是应该是这么去做 但是我怎么把它区分出来呢 哎怎么把这个叉的g b t写的内容 把它区分出来 跟别人到底有什么不一样呢 啊 你说我在前头写我是叉的g b t生成的 行不行那不行啊 人家 上来把你删掉这句话不就完事了吗 对吧

那么怎么能够把这个事情能够解决呢 哎这个就讲到两个技术啊 这个就是内容标识的两个技术 一个叫指纹 一个叫水印 啊指纹也好水印也好 他们的大的前提是什么 就是不能影响阅读 我不能说在你这上头盖一戳 啪然后比如你有个照片 给我在上头盖了个戳 你一眼就看见了啊这事不算 当然有些现在是这种硬水印 上来是一眼就能看到的啊 这个但是呢 正常我们要求的指纹和水印技术 或者叫水纹技术吧 就是你是看不见的啊 你不影响阅读 你看的时候是完全无感的 但是呢 又同时可以标记这个内容的出处 哎这个是我们希望看到的 现在其实也发展出了一些类似的技术 包括声音指纹 声音水纹 比如说我给你唱一歌啊 这个你听这个歌的 整歌的这个音频里头 你没有听出任何的问题来 也没有任何地方说 我这是一个什么什么标记都没有啊 就是一个完整的歌曲 但是呢它里头有一些啊特殊的信息

说我这歌是属于谁谁谁的啊 是呃授权日期到什么什么截止 如果你用了会怎么怎么样啊 他可以直接放进去 但是让你听不出来 为什么呢 就是他叫信虚荣于 就是他这个听歌的整个这个文件里头 或者说整个这个数据流里头 有很多的信息是溶于的你听不到 就是他即使在那个里头有一些呃 小小的噪音或者小的这种波动 你是听不到的哎 他在这个里头去隐藏这些版权信息啊 还有这个 指纹 看刚才咱们讲的实际上是水纹技术 那么指纹技术是什么呢 指纹技术实际上就是信息本身的标记 就是我不在里头写任何其他东西了 你给我一张照片啊 给我一个视频 给我一个音乐啊 甚至是给我一段文字 我都可以自动生成指纹 这个指纹只代表 这个作品本身的一个信息 说这是这个作品 然后剩下我怎么去比对 说到底哪个人侵犯我的权利了 是版权侵犯我的权利了 对吧那我就是自己有一个指纹库 然后到外边去进行指纹比对就完了啊 那你为什么要指纹比对

而不是直接比对完整的一个文件呢 两个作用啊 第一个呢 指纹比对的速度比较快 因为指纹一般是比较短小的 很小的一段文啊 内内容啊和信息 它是把这个很长的 很大的一个内容和信息呢 进行了缩略 然后生成的指纹 这是第一个啊 第二个的要求是什么呢 就是它可以有一定的抗杠抗干扰作用 比如说你有一副照片 我在里边提取了指纹 然后我去看这个照片是不是我的 你把它缩放了啊 变大变小了改颜色了 掉个了啊或者变成画中画了 就是你一张大照片 给他呛了一个小照片 哎我都是依然可以靠这个指纹技术 把你认出来啊 这个是指纹技术真正比较厉害的地方 啊就是现在甭管是音乐 是呃 图片还是视频 都可以使用这种指纹技术 那么水纹技术跟指纹技术比较起来 有一个什么不一样呢 水纹技术是要额外的 再往这个原来的信息里再添东西的 哎添上版权信息

这个东西属于谁 然后呢违法必究 或者是版权到哪哪天哪天 结束他会要把这些信息呢 隐藏在这个里边 这个叫水文信息 但是文字了 现在我们说文字了 这个叉的g p t生成的结果是文字对吧 而且有些很短 那么在这个里头 其实就是做指纹是很难的 因为你已经太短了啊 你这个往里去啊 把它识别一个指纹出来 这个非常非常麻烦啊 为什么呢 因为刚才我们讲的他是靠这个啊 信息溶于的 就是你要有一个地方啊 要多出来赋予出一些信息来 不影响阅读的这些信息啊 所以他这个上的放指纹已经比较难了 就是他信息溶于太小 那怎么办呢 加水纹吧 啊那你说这个信息容易小 我怎么加水纹呢 这个更没地加了 你说指纹我没准还能抽取出来 但是指纹就是它当特别短了以后 它是没有这个防伪作用的 然后也没法去进行比对 因为它太短小了

对吧这个是没有任何意义的啊 那水纹是可以去做的啊 那怎么做啊 跟大家讲一个啊 原来我们在盛大的时候的一个故事 盛大 大家知道有一个分公司叫盛大文学 就是后来起点中文网和阅文 他们呢 当时就面临了一个很麻烦的问题 就是盗版 很多人会盗版他的小说 哎他们是怎么来处理这个问题呢 一开始是把这个小说的VIP章节 做成一个图片 哎就全是做成图片 这个图片啊 你就 没法盗版了吧 因为后来发现图片也没盗版 哎图片盗版了怎么办呢 啊他在图片的左上角和右下角啊 写上一串数字 这个数字是什么呢 是你这个就是每一个人去看这个呃 就是我自己会有一个用户ID吗 就是我去看这张书的时候 我会把这个我自己的用户ID 写在这个图片上 那么如果我发现这张图片被流失了啊 被人传播了 那么就是这个付费账号啊 这个付费用户 他泄露了我的信息

那我就把他的用户一删除就完事了啊 以前是这么处理过一段时间 就是角标序列号 后来呢 这个角标序列号就被他们擦掉啊 但是那那怎么办呢 就把这个角标序列号 写在这个文字里头啊 左上角跟右下角写在这个文字里头 要跟那个文字形成一定的这种交互啊 叫叫交融吧 而且很多人呢会擦那也擦 擦完了以后 就每一张图书的左上角跟右下角 会缺一块 那个文字已经看不清楚了啊 这个后来也没办法 就是道高一尺魔高一丈吧 人家总是要想办法来处理这个问题 啊那怎么办呢 再再想其他的办法 哎其他的办法是什么呢 就是我们今天讲的叫文字水文技术 哎那我怎么做文字水文呢 你这一张小说 我又不能改你的小说对吧 哎这个是这样的 就是呢大家知道这个得的得3个字 其实呢你如果写错了会怎么样哎 如果写错了你会觉得别扭 但是并不影响阅读 对吧你还是能读下来的 这个包括一些常见的这种错别字啊 他也是会在里头进行一些编码

然后呢包括这个呃 文字的上沉和下浮什么意思 因为他是个图片吗 就我写一行字的时候有的字向上一点 有的字向下一点啊 这个呢第一个是可以避免别人去OCR 而且它还用一个比较奇怪的字体 然后另外一块呢 就是你可以靠上沉下浮的这个东西 也形成一个编码 然后证明这个这个文字是从哪来的 还有呢就是做句逗调整 就是句号跟逗号啊 我做一些调整 然后再把它隐藏这个页面里头去 然后我把这些得的得 把这个文字的上下浮动 把这个句号和逗号这种调整 然后把这些编码拎出来 我就可以知道什么呢 这一张图片是在谁啊 哪个付费用户泄露出去的 我可以把他抓出来 然后把他的账号处罚掉 是可以干这个事情 那么现在差的GBT 他其实也要干这么个事 他呢就是 特殊用语啊 特别是注词啊这个把它换掉啊 用一些特殊的排列方式把它换掉 换完了以后 它就可以形成一个编码在里头 你并不影响你阅读

你读的时候呢 正常的你可能都不会觉得有别扭啊 你还是觉得这个事是可以来读的啊 读完了以后 但是你如果让机器去读 他把这个中间这些 呃标点符号 把这些注词 把这些这个不太 有实际意义的词都拎出来 然后呢进行一个编码啊 然后认出来说这是 啊是叉的GPT生成的 就完事了啊 他并不需要去啊 做一个非常复杂的东西 但是他也可以说我能够认出来 就如果你的内容比较多 他没准可以在里头隐藏一些 信息说这是哪个账号谁生成的 他可以做这个事情 对吧 如果说我隐藏的信息没有那么多 但我至少可以标记说这是 叉的g p t生成的一个东西哎 那么这个的话就是可以 实现刚才我们讲的叉的g p t 给它生成的内容 加水文这个事是可以的啊 而且呢是越长的文本越容易标记 你说我就是一行字啊就两行字 那这个东西可能就比较难标记 就没法弄啊 但你说我这个生成了一个

2,000字的小作文啊 或者写了一篇写了一张3,000字的小说 那么这个是相对来说比较容易标记的 啊因为你在里头出现的各种啊 这种注词啊 各种什么这个东西就比较多 然后他可以在里面进行一定的排列 那么这个事是不是会徒劳呢 对吧因为毕竟说这个短文本 这个事基本上无效嘛 然后长文本的话 你其实也可以通过重写 比如说像以前我们做小说的时候啊 最讨厌那种人叫手打团对吧 他就干脆故意帮人坐在那 重新打字打进去啊 这个是你就拿他一点办法没有的完 那么这个 是不是说他们也可以再重敲一次呢 啊是可以的啊 是这个东西是可以绕的过去的 甚至呢可以直接写程序来洗稿啊 现在我已经看到过一些这种AI 写作的程序 专门有一个功能叫洗稿 就是你给他一篇稿件 然后他按照同样的意思给你重写一遍 但是这个所有的这个就是 特别是像论文啊他这个茶虫的重合 度就会急剧下降 他就会能够使形成这样的这种效果啊 写做洗稿程序其实也是很容易 而且很多开源的吧 你可以自己在自己的服务器上

或者在自己的主机上去搭 这个事都没有任何问题 那么一切的问题都是什么问题呢 都叫成本问题啊 不是说这个事啊就没有任何意义啊 这是一个成本问题啊 这个成本问题是什么意思 Open AI开发这个叉的GPT的啊 文字指纹系统啊 文字水文系统 然后呢它会提高 进行大段文字长文字整段抄袭的 成本啊这个事就够了 哎就跟我们以前做这个呃 盛大文学打造版一样 当时我们去接这个任务的时候 我们的老板就问说这个事能够打掉吗 啊我们说打不掉 他说那我为什么还要花 钱让你们做这个事呢 哎然后我们给他的解释就是 我们可以不断的提高 盗版和阅读盗版的门槛和成本 然后在这个过程中可以逐步的提高 订阅正版的转化率啊 听了这个以后 老板就说同意那咱们去做吧 所以差的GPT啊 做这个文字水文系统 也是做同样的目的 他会 不断的提高进行这种常文大段抄袭的 或直接引用的这些人的 使用成本啊

这个事呢就已经达到一定的目的了 就是他最后使用的比例就会下降 哎看到叉的GPT正在研发这样的工具 很多的网友就强烈的呼吁 说open AI晚几年再出哎 推出这个工具吧 啊比如说2026年2027年再去推出吧啊 为什么呢哎 说这个 因为到那个时候他刚好就毕业了 就不用了 这个 其实呢我要劝劝告这位仁兄一下啊 如果你靠着叉叉GPT毕业了 你也没法去上班对吧 你这个是 因为他把你所有的文字 工作都给你处理掉了 写出了很好的论文啊 等你去上班的时候 就完全不是那么回事了 让你去写个报告 让你去写个邮件你就写不出来了 因为你已经依赖了吗 就跟很多人说我依赖做用计算器一样 啊现在等回去说我要重新去啊 口算心算笔算什么这事不会算了啊 那也是很悲催的一个事情 好啊今天就讲到这里 这个故事感谢大家收听 帮忙点赞点小铃铛 参加我们disco讨论群 也欢迎有兴趣有能力的朋友 加入我的会员频道再见

You May Also Like

Leave a Reply

Your email address will not be published. Required fields are marked *