1.Diffusion Model原理详解及源码解析
2.九个直接封神的看番看番网站
3.面试官是如何知道我的简历是假的?
4.源代码影片评价
5.「安卓按键精灵」扒别人脚本的界面源码
Diffusion Model原理详解及源码解析
Hello,大家好,源码我是看番看番小苏
今天来为大家介绍Diffusion Model(扩散模型),在具体介绍之前呢,源码先来谈谈Diffusion Model主要是看番看番用来干什么的。其实啊,源码ustd源码它对标的看番看番是生成对抗网络(GAN),只要GAN能干的源码事它基本都能干。在我一番体验Diffusion Model后,看番看番它给我的源码感觉是非常惊艳的。我之前用GAN网络来实现一些生成任务其实效果并不是看番看番很理想,而且往往训练很不稳定。源码但是看番看番换成Diffusion Model后生成的则非常逼真,也明显感觉到每一轮训练的源码结果相比之前都更加优异,也即训练更加稳定。看番看番
说了这么多,我就是想告诉大家Diffusion Model值得一学。但是说实话,这部分的公式理解起来是有一定困难的,我想这也成为了想学这个技术的同学的拦路虎。那么本文将用通俗的语言和公式为大家介绍Diffusion Model,并且结合公式为大家梳理Diffusion Model的代码,探究其是如何通过代码实现的。如果你想弄懂这部分,请耐心读下去,相信你会有所收获。
如果你准备好了的话,就让我们开始吧!!!
Diffusion Model的整体思路如下图所示:
其主要分为正向过程和逆向过程,正向过程类似于编码,逆向过程类似于解码。
怎么样,大家现在的感觉如何?是不是知道了Diffusion Model大概是怎么样的过程了呢,但是又对里面的细节感到很迷惑,搞不懂这样是怎么还原出的。不用担心,后面我会慢慢为大家细细介绍。
这一部分为大家介绍一下Diffusion Model正向过程和逆向过程的细节,主要通过推导一些公式来表示加噪前后图像间的关系。
正向过程在整体思路部分我们已经知道了正向过程其实就是一个不断加噪的过程,于是我们考虑能不能用一些公式表示出加噪前后图像的关系呢。我想让大家先思考一下后一时刻的图像受哪些因素影响呢,更具体的说,比如[公式]由哪些量所决定呢?我想这个问题很简单,即[公式]是由[公式]和所加的噪声共同决定的,也就是说后一时刻的图像主要由两个量决定,其一是上一时刻图像,其二是所加噪声量。「这个很好理解,大家应该都能明白吧」明白了这点,我们就可以用一个公式来表示[公式]时刻和[公式]时刻两个图像的关系,如下:
[公式] ——公式1
其中,[公式]表示[公式]时刻的图像,[公式]表示[公式]时刻图像,[公式]表示添加的高斯噪声,其服从N(0,1)分布。「注:N(0,1)表示标准高斯分布,其方差为1,源码微信小程序均值为0」目前可以看出[公式]和[公式]、[公式]都有关系,这和我们前文所述后一时刻的图像由前一时刻图像和噪声决定相符合,这时你可能要问了,那么这个公式前面的[公式]和[公式]是什么呢,其实这个表示这两个量的权重大小,它们的平方和为1。
接着我们再深入考虑,为什么设置这样的权重?这个权重的设置是我们预先设定的吗?其实呢,[公式]还和另外一个量[公式]有关,关系式如下:
[公式] ——公式2
其中,[公式]是预先给定的值,它是一个随时刻不断增大的值,论文中它的范围为[0.,0.]。既然[公式]越来越大,则[公式]越来越小,[公式]越来越小,[公式]越来越大。现在我们在来考虑公式1,[公式]的权重[公式]随着时刻增加越来越大,表明我们所加的高斯噪声越来越多,这和我们整体思路部分所述是一致的,即越往后所加的噪声越多。
现在,我们已经得到了[公式]时刻和[公式]时刻两个图像的关系,但是[公式]时刻的图像是未知的。我们需要再由[公式]时刻推导出[公式]时刻图像,然后再由[公式]时刻推导出[公式]时刻图像,依此类推,直到由[公式]时刻推导出[公式]时刻图像即可。
逆向过程是将高斯噪声还原为预期的过程。先来看看我们已知条件有什么,其实就一个[公式]时刻的高斯噪声。我们希望将[公式]时刻的高斯噪声变成[公式]时刻的图像,是很难一步到位的,因此我们思考能不能和正向过程一样,先考虑[公式]时刻图像和[公式]时刻的关系,然后一步步向前推导得出结论呢。好的,思路有了,那就先来想想如何由已知的[公式]时刻图像得到[公式]时刻图像叭。
接着,我们利用贝叶斯公式来求解。公式如下:
那么我们将利用贝叶斯公式来求[公式]时刻图像,公式如下:
[公式] ——公式8
公式8中[公式]我们可以求得,就是刚刚正向过程求的嘛。但[公式]和[公式]是未知的。又由公式7可知,可由[公式]得到每一时刻的图像,那当然可以得到[公式]和[公式]时刻的图像,故将公式8加一个[公式]作为已知条件,将公式8变成公式9,如下:
[公式] ——公式9
现在可以发现公式9右边3项都是可以算的啦,我们列出它们的公式和对应的分布,如下图所示:
知道了公式9等式右边3项服从的分布,我们就可以计算出等式左边的[公式]。大家知道怎么计算嘛,这个很简单啦,没有什么技巧,发源码就是纯算。在附录->高斯分布性质部分我们知道了高斯分布的表达式为:[公式]。那么我们只需要求出公式9等式右边3个高斯分布表达式,然后进行乘除运算即可求得[公式]。
好了,我们上图中得到了式子[公式]其实就是[公式]的表达式了。知道了这个表达式有什么用呢,主要是求出均值和方差。首先我们应该知道对高斯分布进行乘除运算的结果仍然是高斯分布,也就是说[公式]服从高斯分布,那么他的表达式就为 [公式],我们对比两个表达式,就可以计算出[公式]和[公式],如下图所示:
现在我们有了均值[公式]和方差[公式]就可以求出[公式]了,也就是求得了[公式]时刻的图像。推导到这里不知道大家听懂了多少呢?其实你动动小手来算一算你会发现它还是很简单的。但是不知道大家有没有发现一个问题,我们刚刚求得的最终结果[公式]和[公式]中含义一个[公式],这个[公式]是什么啊,他是我们最后想要的结果,现在怎么当成已知量了呢?这一块确实有点奇怪,我们先来看看我们从哪里引入了[公式]。往上翻翻你会发现使用贝叶斯公式时我们利用了正向过程中推导的公式7来表示[公式]和[公式],但是现在看来那个地方会引入一个新的未知量[公式],该怎么办呢?这时我们考虑用公式7来反向估计[公式],即反解公式7得出[公式]的表达式,如下:
[公式] ——公式
得到[公式]的估计值,此时将公式代入到上图的[公式]中,计算后得到最后估计的 [公式],表达式如下:
[公式] ——公式
好了,现在在整理一下[公式]时刻图像的均值[公式]和方差[公式],如下图所示:
有了公式我们就可以估计出[公式]时刻的图像了,接着就可以一步步求出[公式]、[公式]、[公式]、[公式]的图像啦。
这一小节原理详解部分就为大家介绍到这里了,大家听懂了多少呢。相信你阅读了此部分后,对Diffusion Model的原理其实已经有了哥大概的解了,但是肯定还有一些疑惑的地方,不用担心,代码部分会进一步帮助大家。
代码下载及使用本次代码下载地址: Diffusion Model代码
先来说说代码的使用吧,代码其实包含两个项目,一个的ddpm.py,另一个是ddpm_condition.py。大家可以理解为ddpm.py是最简单的扩散模型,ddpm_condition.py是ddpm.py的优化。本节会以ddpm.py为大家讲解。代码使用起来非常简单,首先在ddpm.py文件中指定数据集路径,即设置dataset_path的值,然后我们就可以运行代码了。需要注意的是,如果你使用的是CPU的话,那么你可能还需要修改一下代码中的device参数,这个就很简单啦,大家自己摸索摸索就能研究明白。源码什么意思
这里来简单说说ddpm的意思,英文全称为Denoising Diffusion Probabilistic Model,中文译为去噪扩散概率模型。
代码流程图这里我们直接来看论文中给的流程图好了,如下:
看到这个图你大概率是懵逼的,我来稍稍为大家解释一下。首先这个图表示整个算法的流程分为了训练阶段(Training)和采样阶段(Sampling)。
我们在正向过程中加入的噪声其实都是已知的,是可以作为真实值的。而逆向过程相当于一个去噪过程,我们用一个模型来预测噪声,让正向过程每一步加入的噪声和逆向过程对应步骤预测的噪声尽可能一致,而逆向过程预测噪声的方式就是丢入模型训练,其实就是Training中的第五步。
代码解析首先,按照我们理论部分应该有一个正向过程,其最重要的就是最后得出的公式7,如下:
[公式]
那么我们在代码中看一看是如何利用这个公式7的,代码如下:
Ɛ为随机的标准高斯分布,其实也就是真实值。大家可以看出,上式的返回值sqrt_alpha_hat * x + sqrt_one_minus_alpha_hat其实就表示公式7。注:这个代码我省略了很多细节,我只把关键的代码展示给大家看,要想完全明白,还需要大家记住调试调试了
接着我们就通过一个模型预测噪声,如下:
model的结构很简单,就是一个Unet结构,然后里面嵌套了几个Transformer机制,我就不带大家跳进去慢慢看了。现在有了预测值,也有了真实值Ɛ返回后Ɛ用noise表示,就可以计算他们的损失并不断迭代了。
上述其实就是训练过程的大体结构,我省略了很多,要是大家有任何问题的话可以评论区留言讨论。现在来看看采样过程的代码吧!!!
上述代码关键的就是 x = 1 / torch.sqrt(alpha) * (x - ((1 - alpha) / (torch.sqrt(1 - alpha_hat))) * predicted_noise) + torch.sqrt(beta) * noise这个公式,其对应着代码流程图中Sampling阶段中的第4步。需要注意一下这里的跟方差[公式]这个公式给的是[公式],但其实在我们理论计算时为[公式],这里做了近似处理计算,即[公式]和[公式]都是非常小且近似0的数,故把[公式]当成1计算,这里注意一下就好。
代码小结可以看出,这一部分我所用的篇幅很少,只列出了关键的部分,很多细节需要大家自己感悟。比如代码中时刻T的用法,其实是较难理解的,代码中将其作为正余弦位置编码处理。如果你对位置编码不熟悉,可以看一下我的 这篇文章的附录部分,有详细的介绍位置编码,相信你读后会有所收获。
参考链接由浅入深了解Diffusion
附录高斯分布性质高斯分布又称正态分布,代源码其表达式为:
[公式]
其中[公式]为均值,[公式]为方差。若随机变量服X从正态均值为[公式],方差为[公式]的高斯分布,一般记为[公式]。此外,有一点大家需要知道,如果我们知道一个随机变量服从高斯分布,且知道他们的均值和方差,那么我们就能写出该随机变量的表达式。
高斯分布还有一些非常好的性质,现举一些例子帮助大家理解。
版权声明:本文为奥比中光3D视觉开发者社区特约作者授权原创发布,未经授权不得转载,本文仅做学术分享,版权归原作者所有,若涉及侵权内容请联系删文。
3D视觉开发者社区是由奥比中光给所有开发者打造的分享与交流平台,旨在将3D视觉技术开放给开发者。平台为开发者提供3D视觉领域免费课程、奥比中光独家资源与专业技术支持。
加入 3D视觉开发者社区学习行业前沿知识,赋能开发者技能提升!加入 3D视觉AI开放平台体验AI算法能力,助力开发者视觉算法落地!
往期推荐:1、 开发者社区「运营官」招募启动啦! - 知乎 (zhihu.com)
2、 综述:基于点云的自动驾驶3D目标检测和分类方法 - 知乎 (zhihu.com)
3、 最新综述:基于深度学习方式的单目物体姿态估计与跟踪 - 知乎 (zhihu.com)
九个直接封神的网站
九个网站,直接让你体验非凡!
首先,空痕音乐下载器,这款免费的安卓神器,无需登录,只需输入歌曲或歌手名,就能轻松下载,支持批量下载,无广告打扰,是音乐爱好者的理想选择。通过它,你可以下载到各种类型的音乐,享受无损体验。
对于计算机科学的学生,毕业设计生成器fktool.com/biyesheji则是福音,基于AI的在线工具,轻松填写题目和描述,就能自动生成源码,无论是Java、Python还是PHP,都能应对自如。
腐剧爱好者不能错过腐剧TVfjtv,这里有最新、多样的腐剧资源,还有部分百合内容,只需在公众号私信留言即可获取链接。
俄罗斯的zvu4no无损音乐网,提供海量无损音乐,支持中文搜索,无论是游戏音乐还是古典名曲,都能找到,是音乐探索者的天堂。
接着是异次元漫画阅读器,汇集热门漫画,界面简洁,无广告打扰,无论是日漫还是国漫,都能在这里找到你喜欢的。
影猫**资源网站以思维脑图的形式布局,提供高清解说和混剪,是找剧、看**的好帮手,支持手机访问。
无极磁链则是BT种子和磁力搜索的神器,收录全网资源,种子转磁力功能实用高效,完全免费,无需注册登录。
京墨安卓版是一个专注于古诗词、成语等传统文化的开源阅读软件,内容丰富,无广告干扰,是热爱中华文化的绝佳选择。
最后,樱之空动漫提供海量动漫剧库和高清音乐,无需登录,画质清晰,互动性强,是二次元爱好者的理想基地,主页的周更表确保你不错过任何一部新番。
面试官是如何知道我的简历是假的?
好久面试官来了,开始进行面试。面试官先看了下我的简历,然后说你怎么两年才做这么4个项目,尤其是第一家才1个项目。我说外包公司项目多,没必要挨个写上,写上最近一家公司的项目,和之前公司代表性的项目就行了。然后他就教育了我一番,说怎么写这么点儿呢,很容易让人觉得你啥都没做,做过的都得写上。我之前一直以为我这种两年多经验的写一页简历足够了,不过他说了下我觉得确实可以考虑考虑多写一些。。。不过老实说我在想。。难道他毕业四五年了还把刚毕业的项目往简历上写?
吐槽完项目。面试官不知道为什么看着我的简历以为是培训班出来的,然后就旁敲侧击的问我毕业是否有参加过什么培训啊。我满脸黑线,我简历写的我第一份工作毕业就进去的,而且我项目都是专业领域性很强的项目,这是从哪儿看出来的。然后这面试官又问我那你大学都学什么课程啊,我又耐着性子解释了一圈。然后他看问不出啥的就没问了。然后就问了一个项目有关的正常问题。开始问我技术了。
第一个技术就问我spring框架,然后问我spring主要注重哪些技术,我说了就依赖注入和自动化配置,然后这人问我如何学习spring,我说看了spring实战,深入理解spring架构,然后还看了源码,然后这人说你看了官方文档吗,我说看了小部分,然后他说你怎么不多看官方说明文档呢,我说我更多喜欢直接看看源码设计,而且官方文档更多就是说明书的意思,我觉得用来入门还行,要真正了解肯定还是要深入底层去看下。然后争论了一番后他问我springboot自动化配置如何实现的。我从实现原理,源码流程说了一圈,我估计他应该不懂这块儿,然后我说完后他和我说你觉得看这些东西用处大吗,你为什么不看官方文档。我当时真是满脸黑线,合着这官方文档在他眼中是圣经啊。然后又问我springboot如何实现的tomcat启动,我源码解释了一圈后我估计他还是不懂源码这块儿,所以又和我死磕说你这些东西为什么不看官方文档说明呢。。嗨,我第一次看到对官方文档如此执着的人..。。当然了他举了个有意思的例子,说比如你买了个冰箱,你不看说明书你怎么知道如何使用呢。。我真的很想说我看过这台冰箱深入介绍的几本书并且连内部零件构造都了解你觉得我不会用这台冰箱吗。。
然后框架就没问了,老实说我觉得可能是他也不太了解。。然后就问我sql了,说有没有用过索引,sql优化。我说了一些,然后他说下mysql索引类型呢? 我说你指的哪种类型,是hash/b+tree ,还是聚集索引/非聚集索引,还是普通索引/唯一索引/主键索引/..... 这种。然后我估计他对前两个应该不了解,然后恼羞成怒的来了句你觉得我问的是哪个? 我去,这个我哪能知道。然后我就说了下 hash/b+树索引,然后这个人来了句b+树你觉得是什么,是一种算法,还是xxx,我当时很无语,名字都叫树了这难道不应该是一种数据结构吗。 然后又解释了一圈我感觉他可能也不了解这块也就没问了。然后问我算法。
其实就简单的问了句,你了解哪些排序,我说冒泡排序,插入排序,快排,堆排序.....,然后这面试官嘲讽的笑了一声,我赶紧回想了哪个有问题,结果想了下没想到哪个字说的有问题我就问 你为什么笑,然后他说堆排序是什么东西。老实说听到这句话我是真的很想直接走的,但是想下这对不起我请的一上午假。然后我很克制的说了句,你不知道不代表没有,这是任何一本讲数据结构与算法的书都应该会讲到的东西,建议去百度下。然后这个时候我估计他本就有点儿恼羞成怒的心情被彻底点着了,然后开始问我jmm。哦对了,他看着我写笔试题的时候排序那儿说了句这是什么排序。(我觉得快排方法应该还是挺好认的)
jmm问我五大数据区域,我说了后最后我提了一下直接内存,然后这人我估计也不懂,然后就开始说我问你这个了吗?我让你说五大区域你为什么提这个? 你有听清楚我的问题吗? 我当时就?,合着我这多提了一嘴直接给戳高潮了。。。然后赶紧闭嘴了,让他接着问后面的问题。
然后问了我期望薪资,我说了个期望薪资,结果这人说,你觉得你在项目中能承担部门负责人? 还是项目经理? 合着我期望的薪资在这家公司是部门负责人才有的待遇,看这意思应该是觉得我漫天要价。我觉得我要再说我已经有的三个offer都比我刚提的要多怕不是能让他当场爆炸。。当然了,为了不自讨没趣我就说我只能承担个中级开发吧。。。
最后问我有什么想问的,我就照例问了下公司技术栈,然后他说后端用java nodeJs ,我就问为什么后端会用两种技术栈? 然后他回答道,这么用肯定是处于公司技术考量啊,巴拉巴拉的,反正最后也没说个明白为啥会用两种技术。。然后这个时候提了一嘴既然采用nodeJs是觉得更加方便为什么不考虑考虑使用Python。老实说我觉得我这句话作为大家都是技术人员,技术探讨性的问题应该很正常吧,结果这句话不知道为什么又把他戳高潮了,他直接回到 为什么要用Python?我在严肃的和你讲公司技术栈,你觉得这样好吗? 你觉得这样提问好吗?你这样随意的一问觉得合适吗?
最后伴随着这几个疑问,面试结束了。。。老实说我被面的有点稀奇古怪的,尽管他问的问题我觉得我应该全都回答上了
源代码影片评价
**《源代码》在观众和评论家之间获得了不同角度的评价。Yahoo用户和媒体给予的综合评分分别为B+和B,反映出影片在普通观众中的接受度和专业评价的平衡。烂番茄网站的新鲜度高达%,显示出影片在观众心中的口碑相对较好,票的支持与票的反对形成鲜明对比。 《纽约客》赞誉《源代码》为一部充满悬念的恐怖作品,制作精良,讲述了一个死人试图拯救芝加哥于核灾难的故事,具有经典元素。《华盛顿邮报》则强调了**传递的信息,提醒人们勿忘土拨鼠菲尔效应,倡导和平。导演邓肯·琼斯在这部作品中展现了才华,将科幻小说转化为动人的**体验,预示着他未来有更多的潜力。 《旧金山纪事报》初看可能不显眼,但最终评价其优秀,令人眼前一亮。《底特律新闻》认为《源代码》是一部出色的科幻惊悚片,对得起观众的期待。《丹佛邮报》将其形容为快节奏、引人入胜,带有“土拨鼠菲尔”般预告春天的元素。《纽约时报》将其称为反传统动作片,强调思考的重要性。 尽管《洛杉矶时报》认为情节复杂,演员的出色表演起到了关键作用,而《波士顿环球报》则认为**让人困惑,但又难以抗拒。《纽约每日新闻》给予正面评价,称其为一部不错的**,能触动观众的情感。 影片本身并不追求震撼的画面或惊心动魄的剧情,而是在商业片的外壳下,隐藏着导演深入探讨的概念。影片中经典台词"Everything is gonna be OK"成为影迷心中的亮点,暗示着影片可能隐藏着更深层次的主题和情感。扩展资料
《源代码》Source Code是由著名导演邓肯·琼斯指导, 杰克·吉伦哈尔/ 维拉·法米加 / 米歇尔·莫娜汉 / 杰弗里·怀特 / 拉塞尔·皮特斯 / 迈克尔·阿登等人主演的一部**。讲述了一位在阿富汗执行任务的美国空军飞行员科特史蒂文斯上尉所经历的一系列惊心动魄的事件。「安卓按键精灵」扒别人脚本的界面源码
在一次技术交流中,有朋友向我咨询如何解析别人的安卓脚本界面源码,我虽不擅长直接破解,但分享一下如何通过常规手段揭开这一层神秘面纱。
界面的代码其实并不复杂,主要由几个基础元素构成,模仿起来并不困难。不过,这里我们不走寻常路,而是要深入探究其背后的逻辑和文件结构。
要找到界面代码,首先需要进入脚本的安装目录,通常在"/data/data/"后面跟随应用的包名。打开这个目录,找到其中的"files"文件夹,这个文件夹往往是保存应用界面配置的地方,基于以往的经验,我们先一探究竟。
在一堆与脚本相关的文件中,我们使用文本读取命令逐一探索。代码逻辑是逐个读取文件内容,比如当我们看到script.cfg文件,它虽与界面截图对应,但并非源码,只是记录了用户填写内容的配置信息。
在遍历的输出结果中,我注意到一行标注为"script.uip"的文件。从后缀名判断,这可能是与UI界面相关的。更有趣的是,它包含了一些花括号{ },这提示了我们可能找到了界面源码的线索。
接着,我们面对的是可能存在的乱码问题。按键的乱码可能是加密或编码问题,通过观察问号,猜测是编码错误。编码为utf8的按键支持广泛,我们尝试用转码插件来解决这个问题,以gbk编码为例进行测试,结果出乎意料地顺利。
解决乱码后,我们将调试结果复制到文本中,确认这就是我们寻找的界面源码。将其粘贴回脚本中,界面效果依然保持完好。
但别忘了,包名这一关键信息可能需要用户自行获取。在运行脚本时,可以在界面上找到包名。为了简化操作,我们可以在脚本中直接引入包名,跳过遍历,直接读取界面文件。
至此,我们已经完成了从头到尾的解析过程,代码也变得更加简洁有效。如果你对这些内容感兴趣,不妨试着操作一番,或许会有所收获。
当然,如果你在探索过程中遇到任何问题,或者想要了解更多关于按键精灵的资源,别忘了关注我们的论坛、知乎账号以及微信公众号"按键精灵",那里有更全面的教程和讨论。
2024-12-22 09:24
2024-12-22 09:12
2024-12-22 08:06
2024-12-22 07:57
2024-12-22 07:17
2024-12-22 06:54