zhouzhi – videopipe.cool

Home

VideoPipe视频分析框架开源至今受到了很多人的好评，也有很多成功的商业落地案例。Github仓库中的Sample代码默认只支持CPU和英伟达两种硬件类型（推理部分基于OpenCV::DNN和TensorRT后端），由于某些保密原因，其他硬件平台的适配代码没有公开。随着国产信创化的需求越来越多，国产硬件也是今后AI算法部署落地的新趋势。本篇文章简要介绍如何将VideoPipe移植、适配到不同AI硬件平台，比如华为昇腾、寒武纪、瑞芯微等。

框架移植到不同硬件平台的工作主要涉及到两大块：编解码和模型推理，这两块需要对应的硬件加速。

1、VideoPipe中的编解码部分默认采用Gstreamer管道实现，由OpenCV创建和加载Gstreamer编解码插件，如果你要适配的目标硬件平台本身有对应的GStreamer硬编解码插件，那么编解码移植这块的工作比较简单，直接替换原来软编解码插件为目标平台的硬编解码插件即可。如果没有现成的硬编解码插件可用（大部分时候是这种情况），那么你要做的工作就是参考仓库中/nodes/ffio这个目录中的代码（该目录基于FFmpeg实现了收流、拆包、解码、编码、封包、推流等逻辑），基于目标硬件平台的Codec编解码SDK，去实现自己的硬编、硬解逻辑，封装成VideoPipe中的一个SRC/DES Node即可，然后基于新的SRC/DES节点去构建VideoPipe中的Pipeline。

2、VideoPipe中的模型推理部分默认采用OpenCV::DNN模块实现，它可以加载主流深度学习框架导出的模型格式（如ONNX/Tensorflow/Caffe等），而且支持英伟达平台CUDA加速。当然针对英伟达平台，仓库中还提供了基于TensorRT推理后端的参考实现。如果你要适配其他硬件平台，那么需要基于对应硬件平台的推理Runtime去实现自己的推理逻辑，比如瑞芯微的RKNN、华为的CANN等等。这块其实很简单，直接参考硬件平台厂家提供的推理Demo代码，将其封装成VideoPipe中的一个推理Node即可，然后基于新的推理节点去构建VideoPipe中的Pipeline。

除了编解码和模型推理需要适配移植之外，其他比如OSD画图、颜色格式转换、图片缩放等环节可能也需要使用目标硬件平台的硬件加速API，这块可以参考模型推理移植的步骤，基于目标硬件平台提供的加速API实现对应逻辑即可（如瑞芯微平台的RGA图像处理加速库，专门处理图像缩放裁剪、格式转换等）。整个移植适配的工作其实相当简单，前提是你对适配的目标硬件平台要足够熟悉和了解。

Home

VideoPipe

VideoPipe视频教程

2025-11-112025-12-17

zhouzhi

视频教程一共包含740分钟，分“理论篇”（8章）和“实战篇”（9章）两个部分。

理论部分重点介绍视频分析相关概念和技术栈，适合新手小白学习。实战部分基于VideoPipe框架手把手教你实现“人脸识别”、“车牌识别相机”、“交通事件检测”、“以图搜图”、“车辆检索（属性查询）”、“口算检查（仿作业帮APP）”六个项目原型。

完整教程大纲点击这里。完整教程包含以下内容：

1、理论视频教程（含PPT课件，一共8章/时长约380分钟）。实战视频教程（含PPT课件，一共9章/时长约360分钟）。
2、6个配套的实战案例源码（Github上没有，可1对1指导跑通）。
3、完整的测试数据和测试模型（含全部ONNX原始格式，Github上没有，可以跨平台转换/部署）。
4、1对1答疑（限教程相关问题），相关技术咨询。

微信交流群一起讨论（加zhzhi78）：

2.4 视频结构化相关应用常见架构👇

3.2 视频解码👇

3.4 目标跟踪👇

6.3 行为分析之目标跨线（闯入）👇

7.2 检索比对的前提：特征相似度👇

更多内容联系作者。

Home

Blog

大/小模型在视频分析领域中的联合应用

2025-08-222025-08-22

zhouzhi

CV领域小模型发展

自2012年AlexNet在ImageNet大规模视觉识别挑战赛（ILSVRC）中以显著优势夺冠以来，计算机视觉（CV）领域进入了深度学习驱动的新纪元。AlexNet首次大规模使用卷积神经网络（CNN）进行图像分类，其成功标志着传统手工特征方法的终结，开启了基于数据驱动的深度模型时代。

随后几年，小模型在结构设计上不断优化，追求更高的精度与更低的计算成本。2014年，牛津大学提出的VGG网络通过堆叠3×3小卷积核实现了更深的网络结构，提升了分类性能；同年，Google提出的Inception结构引入多尺度卷积并行处理，显著提高了参数利用效率。

2015年，微软提出的ResNet（残差网络）通过“跳跃连接”解决了深层网络中的梯度消失问题，使得网络可以扩展到上百层，并在ImageNet上取得了超越人类水平的分类准确率。这一突破推动了小模型向更深、更高效的方向演进。

进入2016—2018年，轻量化模型成为研究热点。SqueezeNet证明了在保持精度的同时大幅压缩模型体积的可能性；MobileNet系列（v1/v2/v3）采用深度可分离卷积，在移动端实现了高效的图像分类和目标检测；ShuffleNet则通过通道混洗机制提升轻量模型的表达能力，广泛应用于边缘设备。

在目标检测方面，从Faster R-CNN到SSD，再到YOLO系列（尤其是YOLOv3、v4、v5），小模型逐步实现了从高精度到实时性的跨越。YOLOv5和YOLOv8等版本不仅精度高，且推理速度快，适合部署在摄像头、无人机、机器人等资源受限设备上。

分割任务中，FCN、U-Net、DeepLab系列也不断优化，出现了如BiSeNet、Fast-SCNN等专为实时语义分割设计的小模型，广泛应用于自动驾驶、工业质检等场景。

总体来看，2012—2022年间，CV领域的小模型经历了从“追求精度”到“兼顾效率”的转变，形成了分类、检测、分割三大任务下的成熟轻量级模型体系，为后续边缘智能和实时视频分析奠定了基础。

CV领域小模型瓶颈

尽管小模型在效率和部署便捷性方面表现优异，但在复杂真实场景下的视频分析任务中仍面临诸多挑战：

（1）环境敏感性强

小模型通常依赖于训练数据分布，在光照变化剧烈（如夜间、逆光、雾霾）、天气恶劣或动态背景干扰下，检测与识别性能显著下降。例如，白天表现良好的行人检测模型在夜间可能漏检率上升30%以上。

（2）泛化能力有限

小模型多为单任务专用模型（如仅做人脸识别或车辆检测），对未知类别或新出现的目标类型缺乏识别能力。例如，传统YOLO模型无法识别训练集中未包含的新物体（如新型电动车、特殊工程车辆）。

（3）上下文理解缺失

小模型多基于局部像素信息进行判断，缺乏对场景语义、时空上下文的理解。例如，在拥挤人群中难以区分“正常行走”与“异常聚集”，也无法判断某人是否在“徘徊”或“丢弃物品”。

（4）鲁棒性不足

面对遮挡、尺度变化、姿态变化等情况，小模型容易产生误检或漏检。例如，部分遮挡的目标检测准确率可能下降50%以上。

这些局限性使得仅依赖小模型难以满足高安全要求的视频分析场景（如安防监控、交通管理、工业安全）中对准确性、鲁棒性和语义理解的综合需求。

大模型（多模态）优劣势

2022年底OpenAI发布的GPT3.5迅速掀起了全球大模型浪潮，与此同时（2022年前后）以CLIP、Flamingo、BLIP、Qwen-VL、InternVL等为代表的多模态大模型迅速崛起，成为提升视觉理解能力的重要技术路径。

优势：

（1）强大的语义理解能力

大模型通过海量图文对预训练，具备跨模态对齐能力，能理解图像内容与自然语言之间的深层关联。例如，给定查询“一个穿红衣服的人正在翻越护栏”，大模型可直接从视频帧中定位并判断该行为是否存在。

（2）零样本/少样本识别能力强

得益于大规模预训练，大模型无需微调即可识别数千类未见过的对象或行为，极大提升了系统灵活性。例如，CLIP可在不重新训练的情况下识别“外卖电动车”“共享滑板车”等新兴目标。

（3）上下文与推理能力突出

大模型能结合时间序列、空间关系和语言指令进行逻辑推理。例如，判断“一个人将包留在车站后离开”是否构成可疑遗留物，需结合动作、时间、位置等多维信息。

（4）统一架构支持多任务

一个大模型可同时完成分类、检测、描述生成、问答等多种任务，减少系统复杂度。

劣势：

（1）计算资源消耗巨大

典型多模态大模型参数量达数十亿甚至上百亿，单次推理需高性能GPU（如A100/H100），功耗高、成本大，难以部署在边缘设备。

（2）推理延迟高，难以满足实时性要求

大模型前向推理耗时通常在百毫秒级以上，无法满足视频流每秒30帧的实时分析需求，尤其在高并发场景下性能瓶颈明显。

（3）训练与微调门槛极高

训练大模型需要PB级数据、千卡级算力集群和专业团队，中小企业难以独立完成。

（4）存在“幻觉”风险

大模型可能生成不符合事实的描述或误判，尤其在低质量图像或模糊场景中。

因此，尽管大模型在准确性与智能性上远超小模型，但其高资源消耗与低实时性限制了其在实际视频分析系统中的直接广泛应用。

大小模型联合应用方式

为兼顾效率与智能，“小模型+大模型”协同推理架构逐渐成为视频分析领域的主流解决方案。其核心思想是：由小模型负责高效初筛，大模型负责精准复核与语义理解，实现性能与成本的最优平衡。

常见的联合应用方式包括：

（1）两级级联推理架构

第一级：小模型快速过滤

使用轻量级模型（如YOLOv8、MobileNet-SSD）对视频流进行实时目标检测与初步分类，筛选出感兴趣区域（ROI）或异常事件候选帧。

第二级：大模型精细分析

将候选帧送入多模态大模型（如Qwen-VL、InternVL）进行深度语义解析、行为理解或自然语言问答，确认事件真实性与具体含义。

示例：在地铁监控中，小模型检测到“有人倒地”，触发告警；大模型结合上下文（是否有人搀扶、是否有打斗前兆）判断是否为真实跌倒事件，避免误报。

（2）主动学习与增量更新机制

小模型在运行中遇到置信度低或无法识别的样本时，自动提交给大模型进行标注；

大模型输出结果作为“伪标签”，用于后续小模型的在线微调或增量训练，形成闭环优化。

（3）知识蒸馏（Knowledge Distillation）

利用大模型作为“教师模型”，指导小模型（“学生模型”）学习其输出分布或中间特征表示；

在保持小模型轻量化的同时，提升其语义理解能力。

（4）任务分工协作

小模型负责结构化任务（如人脸检测、车牌识别、人数统计）；

大模型负责非结构化任务（如事件描述、意图推断、开放域问答）；

两者通过中间接口（如消息队列、API服务）协同工作。

这种“分工明确、各司其职”的架构既能发挥小模型的实时性优势，又能调用大模型的智能决策能力。

大小模型联合应用案例

近年来，多个行业已成功落地大小模型协同的视频分析系统，取得了显著成效。以下是几个典型案例：

✅ 案例一：智慧安防中的异常行为识别（某一线城市地铁系统）

背景：地铁站每日客流量超百万人次，需实时监测跌倒、打架、滞留、逆行等异常行为。

方案：

1. 前端摄像头部署YOLOv8 + DeepSort进行实时人体检测与轨迹跟踪；

2.当检测到异常轨迹（如突然倒地、长时间静止）时，截取前后5秒视频片段；

3.视频片段上传至云端大模型（基于Qwen-VL定制）进行语义分析：“此人是否受伤？”“是否有同伴施救？”“是否为醉酒？”

效果：

1.异常事件识别准确率从72%提升至94%；

2.误报率下降60%，显著减轻人工复核压力；

3.平均每路视频日均仅触发3~5次大模型调用，算力成本可控。

✅ 案例二：工业园区安全监管（某化工企业）

背景：需检测工人是否佩戴安全帽、是否进入禁区、是否存在违规操作。

方案：

1.边缘设备部署轻量分割模型（BiSeNet）实时检测人员与装备；

2.若检测到“未戴安全帽”或“进入高危区”，则触发告警；

3.告警帧送入本地部署的裁剪版CLIP模型进行二次验证，排除误检（如头盔反光、阴影遮挡）；

4.支持自然语言查询：“今天有几个没戴安全帽的人进入了反应车间？”

效果：

1.安全违规识别准确率达96.5%；

2.实现零云依赖本地闭环处理，满足数据安全要求；

3.支持开放语义查询，提升管理人员交互体验。

✅ 案例三：零售门店顾客行为分析（连锁便利店）

背景：需分析顾客动线、热区分布、商品关注度，优化陈列。

方案：

1.小模型（MobileNet-SSD）实时检测顾客位置与动作（拿取、放下、停留）；

2.每分钟汇总一次结构化数据（如某货架前停留人数）；

3.每小时将汇总数据与关键帧发送至大模型（BLIP-2）生成可视化报告：“今日最受欢迎商品是矿泉水，主要购买时段为12:00–13:00”；

4.支持语音提问：“昨天下午谁偷拿了商品？” → 大模型结合轨迹与动作分析可疑行为。

效果：

1.数据分析自动化程度提升80%；

2.店长可通过自然语言快速获取洞察，决策效率提高；

3.大模型调用频率低，整体系统稳定高效。

大小模型联合应用效果

某省高速监控视频分析系统累计接入视频路数超过2万路，针对部分传统AI小模型识别难度极大并影响道路安全的突发异常事件（汽车自燃、烟雾、抛洒物、边坡塌方），在引入多模态大模型之后，整体识别效果提升明显。下面是烟雾和道路抛洒物的识别案例（2万路视频样本基数下，准确率趋近99%）：

（右键->新标签打开图片查看原图）

结语

大小模型的联合应用正在重塑视频分析的技术范式。小模型以其高效、低延迟的特点承担“哨兵”角色，实现全天候实时监控；大模型则作为“大脑”，提供深层次语义理解与智能决策支持。二者协同，既避免了大模型的算力黑洞，又弥补了小模型的认知局限。

未来，随着大模型轻量化技术（如MoE架构、量化压缩）、边缘计算能力提升以及多模态推理框架的成熟，大小模型融合将更加紧密，向“端-边-云”一体化智能视频分析系统演进，广泛应用于智慧城市、自动驾驶、工业互联网等领域，真正实现“看得清、看得懂、反应快”的智能视觉感知体系。

Home

VideoPipe

VideoPipe原型演示

2025-08-212025-12-25

zhouzhi

<AI换脸👆>

<车辆结构化👆>

<车辆图片检索👆>

<车辆属性查询👆>

<交通事件检测👆>

<拥堵检测👆>

<人脸识别👆>

<动态管道👆>

<车牌识别相机👆>

<口算识别👆>

<直播分析👆>

Home

Blog VideoPipe

VideoPipe中集成多模态大模型做视频（图片）分析

2025-08-132025-08-14

zhouzhi

VideoPipe是一个用于视频分析和结构化的框架，采用 C++ 编写、依赖少、易上手。它像管道一样，其中每个节点相互独立并可自行搭配，VideoPipe可用来构建不同类型的视频分析应用，适用于视频结构化、图片搜索、人脸识别、交通/安防领域的行为分析（如交通事件检测）等场景。

VideoPipe项目仓库中已经提供了50多个集成传统AI算法模型的Sample源码，涉及到车牌识别、人脸识别、违章检测、图搜、OCR、AI变脸、目标检测、图像分类、图像分割等各个领域。在大模型逐渐成为主流的今天（多模态大模型赋能传统AI视觉算法领域中表现优秀），VideoPipe也支持大模型集成啦，这次重点介绍VideoPipe如何集成多模态大模型来完成视频（图片）分析相关任务。

快速开始
下面基于VideoPipe和阿里云qwen-vl多模态大模型实现一个简单的图片理解的功能：从本地磁盘读取图片序列（现实场景中可以从网络获取图片或视频数据），大模型根据事先定义的Prompt提示词，对图片进行识别理解，依次对图片进行标签化，然后将标签化结果叠加到图片下方，最后显示结果。

1、创建VideoPipe节点类型（事先准备好aliyun大模型服务api_key）
2、将节点串起来，组成Pipeline管道
3、启动管道（一共55行代码）

运行效果

管道运行起来之后，大模型分析节点根据事先定义好的参数（模型名称、提示词、api_key）访问大模型服务，并解析大模型输出，随后显示节点将大模型输出绘制到图片中，并在控制台实时打印。VideoPipe目前支持的大模型后端有：OpenAI协议兼容服务、Ollama/vLLM本地部署服务。

Home

Blog VideoPipe

VideoPipe在高速场景中的应用效果演示

2025-08-042025-08-15

zhouzhi

-1-

-2-

-3-

-4-

-5-

-6-

-7-

-8-

-9-

-10-

Home

NoTechnical

开心快乐

2025-05-302025-05-30

zhouzhi

虽然我跟孩子单独相处的时间比较多，但是很少谈一些比较正式严肃的话题。

上周傍晚带她去眼镜店做眼部保健回来的路上，我突然问了她一个问题：你觉得在学校上学什么最重要？

她马上回答道：安全和健康。这个回答我是提前知道的，因为她妈妈平时跟她提过很多次，她平时也一直对妈妈的话很上心。

我又追问到：除了安全和健康呢？她支支吾吾半天没有回答。

我告诉她：除了安全和健康，还有开心快乐最重要，你可以学习不好，也可以表现不好被老师批评，哪怕是没有养成好习惯导致眼睛过早近视，这些与开心快乐比较起来，都不那么重要了。

她马上补充道：对对，考试最重要，因为只要我每次考100分，我就很开心快乐！

我跟她说：能考100分固然是好，但是在学校开心快乐的事情远不止考试得100分，你可以为交到好朋友而开心快乐，可以与其他人分享小秘密而快乐，甚至下课后能在操场尽情奔跑而开心快乐。

她好像听明白似的连说知道了知道了。

开心快乐是人生长跑过程中的无价之宝，学业、工作、是否婚育这些都要靠边站。因为，

很多事情其实根本没有意义。

吃喝玩乐不是虚度光阴，

吃苦耐劳也不一定值得歌颂。

生命的本质是一场历程，

人生需要不断体验，爱你所爱，

不一定要做世俗认为有意义的事，

如果你想发呆，看日落数星星都有意义。

不断尝试、感受、收获，然后放下，

就像在吃汉堡比赛里，输赢并不重要，

因为怎么样你都能吃到汉堡。

有些道理，有人明白得早，而有的人却明白得太晚。

Home

Blog ModernCVForBeginners

03现代计算机视觉入门之：什么是图片特征编码

2025-01-222025-01-22

zhouzhi

Home

Blog ModernCVForBeginners

02现代计算机视觉入门之：什么是视频

2025-01-172025-01-17

zhouzhi

Home

NoTechnical

桃李春风一杯酒，江湖夜雨十年灯

2025-01-172025-01-21

zhouzhi

有一些颇具江湖之气的诗词，读起来很爽，这些作者里面有些人确实是跨马扬刀在战场上杀过人的。现代社会还是需要一些江湖侠义之气，要婉约、要豪放、还要霸气。下面收集了一些，有的可能只有一两句传唱度比较高的，已经用下划线标明。排名不分先后。

我杀过人，为兄弟挡过刀
首先当然是我们大家熟悉的诗仙李白了。李白一生怀有赤子之心，诗文豪爽大气。相关历史资料说他平时带剑在身，可能真有武术。他诗歌里面经常有“杀”一字，至于是否真的杀过人就不得而知了。他有两首跟江湖有关知名度比较高的诗：
《侠客行》
赵客缦胡缨，吴钩霜雪明。
银鞍照白马，飒沓如流星。
十步杀一人，千里不留行。
事了拂衣去，深藏身与名。
闲过信陵饮，脱剑膝前横。
将炙啖朱亥，持觞劝侯嬴。
三杯吐然诺，五岳倒为轻。
眼花耳热后，意气素霓生。
救赵挥金槌，邯郸先震惊。
千秋二壮士，烜赫大梁城。
纵死侠骨香，不惭世上英。
谁能书阁下，白首太玄经。

《赠从兄襄阳少府皓》
结发未识事，所交尽豪雄。
却秦不受赏，击晋宁为功。
托身白刃里，杀人红尘中。
当朝揖高义，举世称英雄。
小节岂足言，退耕舂陵东。
归来无产业，生事如转蓬。
一朝乌裘敝，百镒黄金空。
弹剑徒激昂，出门悲路穷。
吾兄青云士，然诺闻诸公。
所以陈片言，片言贵情通。
棣华倘不接，甘与秋草同。

第一首诗表面上是李白赞美燕赵侠客精神，实际上是将自己比作侠客，希望能够寻找信陵君这样的明主可以施展政治抱负。我有剑，武功高，能杀人，还不求功名利禄，但求有人赏识我！

第二首诗定位就没这么高了。李白说自己年轻的时候豪爽大气，经常结交一些热血之士。红尘滚滚之中杀过人，也曾为了朋友两肋插过刀，白刀子进红刀子出，千金散尽帮助别人，但并不觉得解人之难是什么了不起的事情。现在我的生活非常落魄，腰间的盘缠也都用完了，请兄弟拉我一把！废话不多说了，你懂的。你如果不帮我，我就去自生自灭了啊。这首诗的创作背景是李白当时仕途不顺，求朋友帮助自己。熟悉李白的朋友可能知道，李白一生仕途都不顺，这种动不动说自己要杀人的人，应该顺不起来。

从上面两首诗可以看到，李白不管是求职还是找朋友帮忙，先要把自己猛夸一顿。不仅仅这两首诗，他其余大部分诗都这样。这是李白裘马轻狂，豪爽用事的真实写照。

少打仗，少杀人
说完李白就应该提杜甫，因为他两齐名。需要注意的是，在当时社会，虽然他两年龄只差11岁，杜甫却比李白名气小太多了。李白现在如果知道他跟杜甫齐名，有可能要发飙。中年的杜甫经历过“安史之乱”，山河破碎，写了很多忧国忧民的诗歌，他的诗歌格局都比较高。这里挑一首我觉得跟本次主题关联性比较大的诗：

《前出塞九首·其六》
挽弓当挽强，用箭当用长。
射人先射马，擒贼先擒王。
杀人亦有限，列国自有疆。
苟能制侵陵，岂在多杀伤。

前出塞有好几首，这是其中之一。这首诗应该是我接触比较早的，可能是小学时候看到的一本书上，还配有插图，只是我读书时代对这些不太感兴趣，基本也背不会。据我了解，杜甫应该没有带兵打过仗，所以这首诗前面的四句应该是他臆想出来的，不过写的非常好。前面四句很好理解，说的是打仗杀敌应该拿最好的武器、还要找准取胜的关键点。后四句话锋一转，开始讲道理了。他说不能无休止的去打仗杀人，国家疆域差不多就行了。能够击退侵犯的敌人就行，不在于要杀多少人。这首诗的创作背景是，当时唐朝打仗频繁，连年征兵上战场，死了很多人，全国人数骤减。

从这首诗作者所要表达的观点来看，杜甫和李白迥然不同。有人可能觉得这一两首诗说明不了什么问题，其实如果再多读读他两其他的诗歌，就会发现他两不仅诗风不同，处事态度也不同，诗歌内容格局自然也就不同了。

戍边杀敌太苦了
有一位边塞诗人大家应该非常熟悉，叫王昌龄，他的有些诗上学的时候必背。王昌龄算作是唐朝边塞诗人鼻祖，唐朝当时很多文人去边疆寻求边功，这人真的去过西域边塞战场，至于有没有亲自拿刀杀过人我就不太清楚了。这里我挑两首比较有代表性的：
《出塞二首·其一》
秦时明月汉时关，万里长征人未还。
但使龙城飞将在，不教胡马度阴山。

《从军行七首·其四》
青海长云暗雪山，孤城遥望玉门关。
黄沙百战穿金甲，不破楼兰终不还。

他的这两首诗的主旨思想都是：戍边战士太幸苦了，但是想到国家人民能够安居乐业，顿时鸡血满满。我们可以看到，作为亲临一线的人和杜甫这种没有上过战场的人思考问题的角度不太一样，所谓屁股决定脑袋。王昌龄深刻体验到了戍边环境的恶劣以及戍边战士的艰辛，但是他秉着“舍小家，保大家”的崇高境界，认为戍守边疆、抵御外敌是军人的指责所在。这样一种矛盾的心情可能也是现如今为祖国戍守边疆战士的心情。

据相关专家考证，王昌龄应该是历史上边塞诗的先驱鼻祖。但是这人最后死得太可惜了，不是战死的，也不是被朝廷陷害死的，是被某地刺史所杀。具体原因不详，有说是因为嫉妒他的才华。

追人杀敌？一切尽在掌握之中
下面要说的这首诗是我个人很喜欢的一首，作者相对来讲不太出名，叫卢纶，也是唐朝诗人。具体内容如下：

《塞下曲》
月黑雁飞高，单于夜遁逃。
欲将轻骑逐，大雪满弓刀。

这首诗的创作背景我其实不太了解，但是这首诗描述的内容我倒是非常喜欢。它描述的是，在一个月黑风高的晚上，敌人（单于代指北方胡人）半夜准备撤离，我方将军正准备集结骑兵部队去追剿，这时候天降大雪，雪花落在战士背上的武器（弓刀）上，挡住了寒气。

敌人要跑没关系，老大率领若干轻骑去追。之所以是轻骑，因为骑兵跑得快，轻装上路。将军胸有成竹，仿佛瓮中捉鳖，因此不需要大军前往。这首诗描写的场景应该是唐太宗时期（初唐，而写这首诗的时间应该是安史之乱之后），唐朝开国名将李靖奉旨扫平突厥的时候，没错这人就是哪吒他爹。

谁需要杀人？请找我
下面这首诗的作者大家应该比较熟悉，名叫贾岛。这人之前是一个和尚，后来还俗了并且受到了韩愈的赏识。他还写过其他比较有名的诗，知道的人肯定比这首要多，比如“松下问童子，言师采药去”。

《剑客》
十年磨一剑，霜刃未曾试。
今日把示君，谁有不平事？

这首诗的字面意思浅显易懂，意思是说，我花十年铸就了一把剑，还未见血，今天将它拿出来给大伙看看，你们谁有不平事呀？可以来找我，我来帮你杀人。当然这只是字面意思，其实作者想要表达的是：我寒窗苦读十几年，非常想要寻得一个赏识我的人，实现我的政治抱负。其实意思跟前面说的李白一样，古人施展自己的才华主要途径是入仕做官，而当官一是靠科举，二是靠人引荐。如果科举屡考不中，那么只能奢求第二种了。

打个猎，突然想上战场杀敌
苏轼一生多次被贬，他写的诗词大部分都是表达豁达乐观的。就这首《江城子·密州出猎》有些江湖气，勉强拿出来：

《江城子·密州出猎》
老夫聊发少年狂，左牵黄，右擎苍，锦帽貂裘，千骑卷平冈。为报倾城随太守，亲射虎，看孙郎。
酒酣胸胆尚开张。鬓微霜，又何妨！持节云中，何日遣冯唐？会挽雕弓如满月，西北望，射天狼。

这首词写于苏轼任密州知州的时候，这时候他还没被贬过。宋朝的疆域其实是中原所有统一王朝中最小的，北宋时期西边有西夏，北边有辽人、后来又来了金人，而且北方的这些人占领了幽云十六州，因此宋朝北边边境缺少了天然的地理保护屏障。苏轼写这首词的时候正逢西夏入侵北宋疆域，喝完酒，打着打着猎，突然觉得自己很牛掰了，所以想象着哪天朝廷能够派他去往边疆抗击西夏入侵。该词读书时肯定背过太熟悉了，此处不再做过多解读，文中引用了好几处典故。

苏轼这首词开启了宋词豪放一派，之前宋朝大部分词都是写爱、写情之类的婉约风格。他好像就这一首有些江湖气，比较符合这次的主题。苏轼嘛，侧重点不在这块。

跨马杀敌，我已经饥渴难耐了
辛弃疾是为数不多的拿过刀、杀过人的古代诗人，证据确凿。他出生于南宋时期，那时候北宋已经经历过“靖康之难”灭亡了，大部分北方疆域被金人占领，南宋疆域面积比北宋更小。他二十岁就带兵抗金杀敌（应该属于自己组织的那种民兵），骁勇善战，有勇有谋。后来投靠南宋朝廷想发挥更大的抗金价值，结果被朝廷雪藏了，一生再没上过战场。他的一生出场就是巅峰，始于武，但是终于文。下面这首词是他被雪藏二十年后写的：

《破阵子·为陈同甫赋壮词以寄之》
醉里挑灯看剑，梦回吹角连营。八百里分麾下炙，五十弦翻塞外声，沙场秋点兵。
马作的卢飞快，弓如霹雳弦惊。了却君王天下事，赢得生前身后名。可怜白发生！

这首词写的是他喝醉酒了，梦到自己上战场杀敌的画面。该词描写的画面也只有亲自上过战场的人才能写得出来，让杜甫和李白去写，肯定没这个效果。这首词是我认为描写沙场打仗画面最好的一首诗词。该词读书时肯定背过太熟悉了，此处不再做过多解读。

那么，辛弃疾为什么会写这么一首词呢？那就要了解一下这首词的创作背景了。他这时候被朝廷雪藏了二十年，基本每天在家种地（可以看一下他写的田园词，非常好）。这时候一个名叫陈亮的人找到他，这人是主战派，主张抗金的人，给朝廷上了很多奏折。两人志向相投，一拍即合，聊着天越聊越兴奋，辛弃疾就幻想着马上可以去战场杀人了。要知道这时候的辛弃疾已经大概五十岁了，只可惜这次会面并没有什么效果，朝廷投降派占主导。最终辛弃疾的一生也在遗憾中结束。

不止杀人，还要干革命
很早之前周杰伦参演的一部张艺谋的电影，电影名叫《满城尽带黄金甲》，其实这个名字取自于一首晚唐名诗，黄巢写的。这人科举考试多次落榜，后来实在受不了了，干脆起义当皇帝，最后搞起了历史上的“黄巢起义”著名事件，掀起了唐朝末年农名起义的浪潮，唐朝也开始真正走向灭亡了。其实他还有另外一首诗也比较有名，两首内容如下：
《不第后赋菊》
待到秋来九月八，我花开后百花杀。
冲天香阵透长安，满城尽带黄金甲。

《题菊花》
飒飒西风满院栽，蕊寒香冷蝶难来。
他年我若为青帝，报与桃花一处开。

我来给大家翻译一下，第一首看名字就知道是考试落榜之后写的，字面意思是：等到秋天九月八重阳节，菊花盛开之后其他的花都凋零了。菊花的香气飘满整个长安城，满城的菊花就像战士身上穿的铠甲一般金光灿灿。其实实际表达的意思可能更接近于：总有一天老子要杀进长安城，我来当皇帝。最终结果确实如这首诗里面讲的这样，黄巢率领起义军攻进了长安城，但是成功并不长久，很快就失败了。

第二首是他起义之前写的，他说菊花盛开的这个季节不太好，秋天有风又冷还没有蝴蝶，什么时候他当了青帝，要让菊花和桃花一样，在春天盛开。这首诗多么霸气，不服不行。我觉得黄巢的这两首诗是古代干革命的人写的诗中最好之一，像后来清朝末年天平天国的洪秀全，也是考不上跑去干革命了，但是写出来的诗比这个差远了。另外，从黄巢的人生经历来看，肯定是真杀过人的了。

死了也要去阴间杀阎罗
提到干革命，这里不得不说一下咱们伟大的开国元帅——陈毅。1936年国民党围剿时，陈毅率领的游击队被困于梅岭（大概在江西和广东接壤处），形势非常不妙，于是写下了下面三首诗：
《梅岭三章》
断头今日意如何？创业艰难百战多。
此去泉台招旧部，旌旗十万斩阎罗。

南国烽烟正十年，此头须向国门悬。
后死诸君多努力，捷报飞来当纸钱。

投身革命即为家，血雨腥风应有涯。
取义成仁今日事，人间遍种自由花。

近现代诗的内容没有古诗那么难于理解，基本就是字面上的意思。“此去泉台招旧部，旌旗十万斩阎罗。”意思是说，即使我被杀，去了阴曹地府也要集结之前死去的旧部，继续斩杀国民党反动派。而“后死诸君多努力，捷报飞来当纸钱。”跟陆游的“王师北定中原日，家祭无忘告乃翁”有异曲同工之妙。我死之后，渴望收到前方传来的捷报。

陈毅肯定也是为数不多亲自杀过人的诗人，梅岭遭劫，最终突围了。这三首诗慷慨激昂，非常适合青少年读。另外再多说一下这个梅岭，这个位置在古代应该属于岭南瘴毒之地，即使不是，可能也远不了。古代当官儿的只要被贬，比较惨的基本都被贬到了岭南，因为这个地方环境恶劣，湿热虫多，主要古代没有空调电扇，广州没有空调夏天能住人不？苏轼有一句词“试问岭南应不好，却道，此心安处是吾乡”，可见这个地方大家都怕（苏轼后来也被贬到这个地方了）。杜牧有一首诗写的杨贵妃，“一骑红尘妃子笑，无人知是荔枝来”，里面描写驿卒快马加鞭将荔枝从岭南运往洛阳，大概就是要经过这里吧。

废话太多，小心我砍你
大家一提到朱元璋，就说他是乞丐出身，当过和尚要过饭。其实他也有一些江湖霸气的诗句流传下来：
《示僧》
杀尽江南百万兵，腰间宝剑血犹腥！
老僧不识英雄汉，只管哓哓问姓名。

传说当年朱元璋起义时经过金陵的一个寺庙。寺庙的和尚不认识他，一直问他是谁，朱元璋被问不耐烦了，提笔写下这首诗。他说，老子江南杀人千千万，腰间的宝剑上还能闻出血腥味，这里的一个老和尚居然不认识我这个大英雄，逼叨逼叨没完没了。言下之意是，你再问小心我拿剑砍你。

有人说朱元璋的诗词创作水平不高，那是肯定的，毕竟没有正儿八经上过学，底子薄。跟其他一些帝王将相相比，差很远。比如五代南唐后主李煜，北宋耻辱之帝宋徽宗，他们适合搞这些，但就是不适合当皇帝。康熙乾隆写过很多诗，乾隆爷写过四万首，但是你背过嘛？

你们都不行，让我来
最后让主席来镇楼，主席的诗词大气磅礴，不是一般人写得出来的，读起来非常爽。原因很简单，人家干过这个事情，你让李白杜甫苏轼来写，打死估计也写不出来。下面以这首《沁园春·雪》结尾：

《沁园春·雪》
北国风光，千里冰封，万里雪飘。
望长城内外，惟余莽莽；大河上下，顿失滔滔。
山舞银蛇，原驰蜡象，欲与天公试比高。
须晴日，看红装素裹，分外妖娆。

江山如此多娇，引无数英雄竞折腰。
惜秦皇汉武，略输文采；唐宗宋祖，稍逊风骚。
一代天骄，成吉思汗，只识弯弓射大雕。
俱往矣，数风流人物，还看今朝。

主席把中国牛掰一点的帝王全部都鄙视了一遍，嬴政、刘彻、李世民、赵匡胤这些人都不行，总觉得哪里差了点，成吉思汗简直莽夫一个，只知道骑马打猎杀人。看现在，风流人物还是得看我（们）呀！不得不说，主席不仅带兵打仗厉害，写诗也强得很。这首词完全没有自大的表象，倒是让人一读振奋人心，激昂斗志。

Author: zhouzhi

关于VideoPipe适配不同AI硬件平台的流程

VideoPipe视频教程

大/小模型在视频分析领域中的联合应用

VideoPipe原型演示

VideoPipe中集成多模态大模型做视频（图片）分析

VideoPipe在高速场景中的应用效果演示

开心快乐

03现代计算机视觉入门之：什么是图片特征编码

02现代计算机视觉入门之：什么是视频

桃李春风一杯酒，江湖夜雨十年灯