0%

CNN

空间不变性: 检测对象和图像位置无关
局部性:先从局部区域特征做起,在高层再集成局部特征预测

从全连接层到卷积

\([\mathbf{X}]_{i, j}\)\([\mathbf{H}]_{i, j}\)分别表示输入图像和隐藏表示中位置\((i,j)\)处的像素。且不妨使\(k = i+a\),\(l=j+b\) \[ \begin{split}\begin{aligned} \left[\mathbf{H}\right]_{i, j} &= [\mathbf{U}]_{i, j} + \sum_k \sum_l[\mathsf{W}]_{i, j, k, l} [\mathbf{X}]_{k, l}\\ &= [\mathbf{U}]_{i, j} + \sum_a \sum_b [\mathsf{V}]_{i, j, a, b} [\mathbf{X}]_{i+a, j+b}.\end{aligned}\end{split} \]

需要完成的目标:

  1. 平移不变形:\(\mathsf{V}\)\(\mathsf{U}\)实际上不依赖于\((i,j)\)的值,即\([\mathsf{V}]_{i, j, a, b} = [\mathbf{V}]_{a, b}\)。即卷积核不变,简化\(\mathsf{H}\)为:

    \[ [\mathbf{H}]_{i, j} = u + \sum_a\sum_b [\mathbf{V}]_{a, b} [\mathbf{X}]_{i+a, j+b}. \]

    这就是卷积(准确来说卷积层是个错误的叫法,卷积层用到的其实是互相关运算 (cross-correlation),而不是卷积运算),使用\([\mathbf{V}]_{a, b}\)对位置\((i,j)\)附近的像素\((i+a,j+b)\)进行加权得到\([\mathbf{H}]_{i, j}\)

  2. 局部性: 即给\(a,b\)一个范围限定,使其不要联系到很远的位置,得到\([\mathbf{H}]_{i.j}\)
    \[ [\mathbf{H}]_{i, j} = u + \sum_{a = -\Delta}^{\Delta} \sum_{b = -\Delta}^{\Delta} [\mathbf{V}]_{a, b} [\mathbf{X}]_{i+a, j+b}. \] 这就是卷积层,\([\mathbf{V}]\)即是卷积核

卷积数学定义:

卷积是测量 f 和 g 之间(把其中一个函数“翻转”并移位 x 时)的重叠。
>注意这个翻转,实际上卷积层不使用翻转,是互相关运算

\[ (f * g)(\mathbf{x}) = \int f(\mathbf{z}) g(\mathbf{x}-\mathbf{z}) d\mathbf{z}. \]

离散形式:

\[ (f * g)(i) = \sum_a f(a) g(i-a). \]

多通道

图像往往包含三通道,即每个像素点还包括一个长度为3的数组,因此卷积操作也要扩展一个维度:

\[ [\mathsf{H}]_{i,j,d} = \sum_{a = -\Delta}^{\Delta} \sum_{b = -\Delta}^{\Delta} \sum_c [\mathsf{V}]_{a, b, c, d} [\mathsf{X}]_{i+a, j+b, c}, \]

多通道

图像往往包含三通道,即每个像素点还包括一个长度为3的数组,因此卷积操作也要扩展一个维度:

\[ [\mathsf{H}]_{i,j,d} = \sum_{a = -\Delta}^{\Delta} \sum_{b = -\Delta}^{\Delta} \sum_c [\mathsf{V}]_{a, b, c, d} [\mathsf{X}]_{i+a, j+b, c}, \]

基础流程

客户端流程:

  1. socket.Connect(远程IP地址,远程端口)
  2. socket.Send/BenginSend发送数据
  3. socket.Receive/BeginReceive接收服务端数据
  4. 网络操作(如心跳协议)
  5. socket.Close关闭连接

服务器流程:

  1. listenfd.Bind(ipEp)将创建的空套接字listenfd绑定到IP+端口。
  2. listenfd.Listen(backlog)开启监听
  3. listenfd.Accept/BeginAccept接收客户端连接。Accept/EndAccept返回连接的Socket对象,对于服务器来说,它有一个监听Socket(listenfd)用来监听(Listen)和应答(Accept),对每个客户端的连接再创建一个专门的Socket(connfd)用来处理该客户端的数据。
  4. connfd.Receive/BeginReceive 接受数据
  5. 网络操作(如心跳协议)
  6. socket.Close关闭连接
阅读全文 »

裁剪片段

ffmpeg -ss hh:mm:ss -i input.mp4 -t 60 -c copy output.mp4

ffmpeg -ss 起始时间 -i 输入视频 -t 持续时间 -c copy 输出视频

转换格式(包括音频)

ffmpeg -i input.mp4 output.mp3

规格修改

转换分辨率 ffmpeg -i input.mp4 -filter:v scale=1280:720 -c:a copy output.mp4 转换比特率 ffmpeg -i input.mp4 -b 5000K output.mp4

确定阅读目标

  1. 能够重述给听众
  2. 跟踪领域前沿技术
  3. 调研一个新的领域

根据自己的阅读目的调整自己的阅读深度。

三步走方法

不要每一篇论文都从开始硬读到结尾,而是分段为三步走。每一步建立在上一步的基础之上,并且需要完成这一步应有的目标。

第一步:了解论文总体的idea 第二步:掌握论文的大致内容,但不需要在乎细节。 第三步:深度理解论文

阅读全文 »

准备

必备:

  • 身份证,很多地方刷身份证拿门票。
  • 口罩,路上随意,地铁景点必需。
  • 随申码(上海的健康码),支付宝或微信提前注册好。

注意:

  • 是否需要预约线上买票,疫情期间蛮多景点要的。
  • 学生证,门票降价。
  • 水,室内景点需要。
  • 地铁,手机有NFC功能可以开通NFC上海地铁卡,刷手机就行。没有的话下一个metro大都会APP刷二维码。
  • 充电宝,看手机情况。
  • 考虑考虑现金硬币?公交轮渡小玩具可能需要投币。
  • 下个单车APP,美团什么的。
阅读全文 »