看着存储空间不到 5 个 G 的手机决定手贱给小米 6 刷一次机,在看到 rom 列表中没有 MIUI 12 的线刷版本隐隐感到一丝不对劲,但还是艺高人胆大地选择了线刷 MIUI 10 9.9.3 + 卡刷 MIUI 12 20.6.18 的路线,然而刷完 MIUI 10 在系统里刷 MIUI 12 的时候发现还是天真了。选官方 ROM 包的时候提示“rom包处于内测中 请确认已经登录有内测权限的小米账户”,现在哪里还有小米 6 的内测?退一万步讲就算有我还有等你内测审核完我才可以刷机?(你永远不知道小米为了让 MI6 用户换手机有多努力)

Read more »

看过这么多 tutorial,跟着 Hadoop 的 tutorial 跑一个 Hello World 是最 suffer 的一次。看过的包括但不限于 《Hadoop 权威指南》,某乎的文章,CSDN 上的经验,最后再加上官网的文档才勉强安装好跑出 WordCound 的结果……心累。

Prerequisites

  • GNU/Linux。这里用的是 WSL Ubuntu-20.04
  • Java。 这里用的是 openjdk version “11.0.13”
  • ssh。
  • Hadoop 的安装包。可以在 Apache Download Mirrors 下载,这里用的是 hadoop-3.3.2.tar.gz

JDK Enviorment Setting

Read more »

这几天系统复习了下 SQL 的窗口函数,补全了很多之前的知识盲点。虽然之前工作中窗口函数用的不多(没办法,之前的工作对 SQL 并没有很依赖,实际经验积累也就很鸡肋了),不过以现在的数据分析师技术栈来看,不会窗口函数都不敢说自己懂 SQL 了(再不掌握哪些可恶的窗口函数,小孩哪能手撕 offer,祖国哪有栋梁之才)

大多数网站对窗口函数的定义大都是可以对数据库数据进行实时分析处理的函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理)。我对窗口函数的理解是,对数据分区排序(不一定都要有),并按照每行数据的在分区内的位置以及排序的位次来进行某种计算或处理,并将结果附加在原来的数据上同时不改变行数。

Read more »

2021 年总结

  • 掐着点看完了沐神的动手学习深度学习视频(仪式感要拉满,学习效果另说:) )
  • 系统学了下 Excel VBA ,总结了下 VBA 面向对象学习的方法(就当学了个玩具语言)
  • 算法和数据结构有了一点了解(知道几个名词其实就可以吹了…啥,徒手写一个?)
  • 开始写年度总结(就硬凑数?)

2022 年规划

  • 完成深度学习和机器学习的知识框架构建,方法论和落地能力两开花,开始看论文追踪前沿技术,并有一两个拿得出手的项目
  • 尽量掌握大数据通用技术栈,能在本地装好 Hadoop 并写点代码比划下,能写出不怎么难看的 Spark 代码并部署在 Airflow 上
  • LeeCode 高频题刷完
  • 拿下 Java SE 和 C++,Python 看几个项目源码
  • 把上年度书单里没看完的书看完,并在本年度书单里加一些书
  • 治好拖延症,平衡作息时间,继续心理建设

VBA 其实是可以(有限地)支持面向对象编程的。在 VBA 里有一些内置的类:Collection, Workbook, Worksheet 等等,但我们可以用 Class Modules 来构建自己需要的类。

创建一个类时,insert 后面选 Class Module, 然后在属性窗口修改默认的命名(如 CTest)。然后在第一行声明一个变量:

1
2
'Class Module: CTest
Public Name As String

现在在普通的 Module 里就可以引用这个类了:

Read more »

日常生活中经常能看到利用被收集到的数据来提供建议或者推荐产品的例子。比如在京东购买了关于 Hadoop 的书,JD App 就会看到 Spark 相关的书排在很靠前的位置。本文将尝试用 Python 来实现一个简单的推荐算法模型。

假设我们有如下用户数据:

Read more »

假设我们有如下数据:

年龄 拥有的汽车数量 是否有房子 子女数量 婚姻状况 是否养狗 是否买过船
0 66 1 2 丧偶
1 52 2 3 已婚
2 22 0 0 已婚
3 25 1 1 单身
4 44 0 2 离异
Read more »

总结下经常用到的 FFmpeg 命令。

  1. webm/m4a to mp3
    1
    ffmpeg -i input.m4a/.webm -acodec libmp3lame output.mp3
  2. ts to mp4
    1
    ffmpeg -i input.ts -vcodec copy -copyts -acodec copy -absf aac_adtstoasc output.mp4
  3. mp4 to avi
    1
    ffmpeg -i input.avi -vcodec mpeg4 -vtag xvid output.avi
Read more »

图的术语和定义

顶点

顶点又称节点,是图的基础部分。顶点的名字被称为“键”。顶点也可以带有附加信息,我称作“有效载荷”。

边是图的另一个基础部分。两个顶点通过一条边相连,表示它们之间存在关系。边既可以是单向的,也可以是双向的。如果图中的所有边都是单向的,我们称之为有向图。

Read more »

树的术语和定义

节点

节点是树的基础部分。节点可以有自己的名字,被称作“键”,节点也可以有附带信息,被称为“有效载荷”。

两个节点通过一条边相连,表示他们之间存在关系。除了根节点之外,其他每个节点仅有一条入边,出边则可能有多条。

Read more »