分类：学习笔记

【Ai】在Windows系统本地部署DeepSeek-R1的极简步骤

惊闻B站有人出售百元本地部署教程，NND给我看笑了，什么都能卖钱是吧，当然不排除人家手把手教，提供足够的情绪价值。

但是如果你不想花钱，同时想提升一下英文水平和计算机熟练度，请跟着官方文档一步步进行，目前的文档已经相当详细且可行。

我们如果在Windows上进行部署和调试，推荐使用Open WebUi+Ollama的方式进行部署。

PS：其实更建议在Linux上进行部署，一键部署更加便利~

1、选择后端Ollama

在Ollama官网选择Win版本下载，会自动部署相关环境，在CMD或者中powershell可以按照对应的模型拉取到本地。

请根据自己的硬件量力而行。我的显卡为RTX3070 8G，按照ollama默认设置，运行7B已经亚历山大。

2、选择前端Open-WebUi

请根据您的系统，在Open-WebUi的官方文档，按照步骤，一步步来进行部署。

Win版本下按照官方建议，可以使用uv，在powershell中进行拉取和部署，其中对网络环境有一定要求。

3、启动Open-WebUi后的注意事项

Open-WebUi原版毕竟是国外软件，在国内这个环境启动还是有一点网络困扰的，尤其是有些文件是通过Github的地址获取的，请对自己的网络环境做出一些针对性的优化调整。

另外完成本地部署后，如果是启动在127.0.0.1上，那么检查ollama的端口是否running，一般按照官方部署都可以进行顺畅进行（只有国内这个网不太顺畅）

此外Open-WebUi默认检查OpenAi的API，这个选项可以在首次登陆后去管理员面板关闭，这样不会每次启动都遇到拉取模型缓慢、超时的情况。

4、其他分享

我的电脑采用13700K 32G DDR5 RTX3070 8G，但大模型运行需要大显存，8G显存只能算起步，参数量只能流畅运行7B左右的模型，因此一般的家用和办公电脑跑大模型都存在很大的限制。

RTX3070 8G跑DeepSeek-R1:7B的速度——显存爆满，ollama默认设置，显示CPU处理占用10%，GPU处理占用90%，常规问答的response token/s在39左右，prompt_token/s在2500左右。但是大模型性能存在一定的短板，长上下文效果不尽如人意。

RTX3070 8G跑DeepSeek-R1:14B，ollama默认设置命令行中速度可以接受，在WebUi中短回答response token/s约为14，较长的上下文降低到7不到，一半跑在GPU一半跑在CPU，长文本效果很差。

RTX3070 8G跑DeepSeek-R1:32B，ollama默认设置在命令行中速度还行，缓慢但可以简单对话，处理长文本速度基本不可用。若用13700K跑在CPU则32G内容跑满，速度也是非常慢。

在跑完Ai测试后，请关闭Ollama的进程，否则你将面临满占用的显存或内存~

5、体验

搭配Open-WebUi可以实现本地部署，多端使用，但是对体验影响更大的限制——模型本身——我们个人、及小公司的计算性能均没法有效支撑，本来大模型就是为了提升效率，本地部署一个跑的死慢的模型，对效率的提升实在是存疑。

当然我鼓励大家都去本地部署体验一下，从中也可以获得一些乐趣，但是如果到实际应用层面，大一些的模型硬件需求激增，小公司玩这个自建后端的硬件成本还是太高了。

因此，对小公司而言，可能选择一个大树，使用API，保护好自己的数据（真的是有价值的数据吗？）进行针对性的训练，拓展自己的RAG系统，做好本地化的情况下拥抱云计算，才是提升小公司效率的一条路吧。

但话说回来，小公司真的愿意为这个人工和软件成本付费吗？

2025年2月10日

【Python】提取视频画面并生成PPT

比较笨的方法，用来提取PPT课程视频画面，并生成对应的PPT，代码检测黑屏但没有检测白屏，没有检测重复画面（因为有些人讲课会来回翻PPT），因此还有优化空间。内存占用会逐渐增多，不过测试没有出现崩溃的情况。

PS：做完发现可以直接问讲课人要PPT原件，我，，，

import cv2
import os
import numpy as np
from pptx import Presentation
from pptx.util import Inches
from skimage.metrics import structural_similarity as ssim
import tkinter as tk
from tkinter import filedialog, messagebox

# 选择视频和输出目录
def select_video_and_output():
    video_path = filedialog.askopenfilename(title="选择视频文件", filetypes=[("MP4 files", "*.mp4")])
    if not video_path:
        messagebox.showwarning("选择视频", "未选择视频文件")
        return None, None
    
    output_dir = filedialog.askdirectory(title="选择输出目录")
    if not output_dir:
        messagebox.showwarning("选择输出目录", "未选择输出目录")
        return None, None

    pptx_path = os.path.join(output_dir, "output_presentation.pptx")
    return video_path, pptx_path

# 处理视频并生成 PPT
def process_video_to_ppt(video_path, pptx_path):
    os.makedirs("ppt_images", exist_ok=True)
    
    cap = cv2.VideoCapture(video_path)
    _, prev_frame = cap.read()
    prev_gray = cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY)

    frame_count = 0
    slide_count = 0
    images = []
    similarity_threshold = 0.95  # 提高 SSIM 阈值，减少相似图片
    brightness_threshold = 10  # 黑屏检测（平均亮度 < 10 认为是黑屏）

    def process_frame(frame):
        """ 计算 SSIM 相似度，判断是否保存该帧 """
        nonlocal prev_gray, slide_count
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        score = ssim(prev_gray, gray)

        # 计算平均亮度，过滤黑屏
        avg_brightness = np.mean(gray)
        if avg_brightness < brightness_threshold:
            return  # 跳过黑屏帧

        if score < similarity_threshold:  
            img_path = os.path.join("ppt_images", f"slide_{slide_count}.jpg")

            # 确保不同的幻灯片才保存
            if len(images) == 0 or images[-1] != img_path:  
                cv2.imwrite(img_path, frame)
                images.append(img_path)
                slide_count += 1
                prev_gray = gray  # 只在确认变化时更新参考帧

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        # 仅每隔 15 帧处理一次
        if frame_count % 15 == 0:
            process_frame(frame)

        frame_count += 1

    cap.release()
    # cv2.destroyAllWindows()

    # 创建 PPT
    prs = Presentation()
    for img in images:
        slide = prs.slides.add_slide(prs.slide_layouts[5])  # 空白幻灯片
        left, top, width, height = Inches(0), Inches(0), Inches(10), Inches(7.5)
        slide.shapes.add_picture(img, left, top, width, height)

    prs.save(pptx_path)
    messagebox.showinfo("完成", f"PPTX 生成完成: {pptx_path}")

# 主函数
def main():
    root = tk.Tk()
    root.withdraw()  # 隐藏主窗口
    video_path, pptx_path = select_video_and_output()
    if video_path and pptx_path:
        process_video_to_ppt(video_path, pptx_path)

if __name__ == "__main__":
    main()

2025年2月10日

【Python】使用cwebp、gif2webp、exiftool实现保留exif信息的WebP转换

此前写了个使用cwebp、gif2webp的脚本，但是由于cwebp目前在win的元数据提取存在问题，因此我们可以使用已经支持exif提取和写入的exiftool进行最后一步的转换，这样我们的图片压缩、转码都在官方库得以实现。

前置条件：

cwebp、gif2webp、exiftool三个组件都注册到系统环境变量。python则使用pil库用于分辨率获取。

实现效果：

使用pil库对分辨率进行获取，但是不介入压缩过程，因为cwebp目前没法获取图片分辨率，使用pil库进行是否执行resize的判断。

使用cwebp处理静态png、jpg，使用gif2webp处理gif图，启用mt多线程，压缩质量85，resize到2560最长、宽边，exiftool采用”-overwrite_original”来避免生成两个图片。

测试效果：

该图片原图7M多，压缩质量选择85，可能由于细节较为丰富，压缩到WebP大小仍为1M左右，还是比较大，不过细节保留充分，同时保留了EXIF信息。

import tkinter as tk
from tkinter import filedialog, messagebox
import os
import subprocess
from PIL import Image

def validate_file(input_path):
    input_path = os.path.abspath(input_path)
    if not os.path.exists(input_path):
        raise FileNotFoundError(f"文件 {input_path} 不存在，请检查路径。")
    return input_path

def get_resized_dimensions(width, height, max_size):
    if width > height:
        new_width = max_size
        new_height = int((new_width / width) * height)
    else:
        new_height = max_size
        new_width = int((new_height / height) * width)
    return new_width, new_height

def convert_image(input_path, output_path, new_width=None, new_height=None):
    try:
        file_extension = os.path.splitext(input_path)[1].lower()
        if file_extension == ".gif":
            command = ["gif2webp","mt", input_path, "-o", output_path]
        else:
            if new_width and new_height:
                command = ["cwebp","mt", "-q", "85", "-resize", str(new_width), str(new_height), input_path, "-o", output_path]
            else:
                command = ["cwebp","mt", "-q", "85", input_path, "-o", output_path]
        subprocess.run(command, check=True)
    except subprocess.CalledProcessError as e:
        raise RuntimeError(f"转换工具运行出错: {e}")

def embed_exif(input_path, output_path):
    try:
        command = ["exiftool", "-overwrite_original", "-tagsfromfile", input_path, "-all:all", output_path]
        subprocess.run(command, check=True)
    except subprocess.CalledProcessError as e:
        raise RuntimeError(f"EXIF 数据嵌入失败: {e}")

def convert_to_webp(input_path, max_size=2560):
    try:
        # 验证文件路径
        input_path = validate_file(input_path)
        output_path = os.path.splitext(input_path)[0] + ".webp"

        # 使用 PIL 获取图像分辨率
        with Image.open(input_path) as img:
            width, height = img.size
            if width <= max_size and height <= max_size:
                convert_image(input_path, output_path)
            else:
                new_width, new_height = get_resized_dimensions(width, height, max_size)
                convert_image(input_path, output_path, new_width, new_height)

        # 嵌入 EXIF 数据
        embed_exif(input_path, output_path)

        return f"图片已转换并保存为 {output_path}"

    except (subprocess.CalledProcessError, FileNotFoundError) as e:
        return str(e)
    except Exception as e:
        return f"处理文件时发生错误: {e}"

def select_files():
    file_paths = filedialog.askopenfilenames(
        title="选择图片文件",
        filetypes=[("*所有图片格式", "*.jpg;*.jpeg;*.png;*.gif"),
                   ("JPEG 图片", "*.jpg;*.jpeg"),
                   ("PNG 图片", "*.png"),
                   ("GIF 图片", "*.gif")]
    )
    if file_paths:
        for path in file_paths:
            file_listbox.insert(tk.END, path)

def convert_and_save_batch():
    files = file_listbox.get(0, tk.END)
    if not files:
        messagebox.showerror("错误", "请选择至少一个图片文件！")
        return

    results = [convert_to_webp(file_path) for file_path in files]
    messagebox.showinfo("完成", "\n".join(results))

def clear_list():
    file_listbox.delete(0, tk.END)

root = tk.Tk()
root.title("批量图片转换为 WebP 工具")
root.geometry("600x400")

frame = tk.Frame(root)
frame.pack(pady=10, padx=10, fill=tk.BOTH, expand=True)

scrollbar = tk.Scrollbar(frame, orient=tk.VERTICAL)
file_listbox = tk.Listbox(frame, selectmode=tk.EXTENDED, yscrollcommand=scrollbar.set)
scrollbar.config(command=file_listbox.yview)
scrollbar.pack(side=tk.RIGHT, fill=tk.Y)
file_listbox.pack(side=tk.LEFT, fill=tk.BOTH, expand=True)

button_frame = tk.Frame(root)
button_frame.pack(pady=10)

select_button = tk.Button(button_frame, text="选择文件", command=select_files, width=15)
select_button.grid(row=0, column=0, padx=5)

clear_button = tk.Button(button_frame, text="清空列表", command=clear_list, width=15)
clear_button.grid(row=0, column=1, padx=5)

convert_button = tk.Button(button_frame, text="批量转换", command=convert_and_save_batch, width=15)
convert_button.grid(row=0, column=2, padx=5)

root.mainloop()

2025年1月8日

分类： 学习笔记

【Ai】在Windows系统本地部署DeepSeek-R1的极简步骤

【Python】提取视频画面并生成PPT

【Python】使用cwebp、gif2webp、exiftool实现保留exif信息的WebP转换

分类：学习笔记