二级分类策略强化语法
约 1401 字大约 5 分钟
2025-05-13
指南简介
- 为了实现更精细化、自动化的影片管理,我们引入了多项高级分类功能,包括负号排除、关键词匹配及系列化分类。
- 本文档将详细介绍这些功能的使用方法和配置技巧。
支持功能语法
1. 负号排除匹配
支持在分类规则中使用负号 - 来排除特定的类型 ID。
语法格式:
纪录片:
genre_ids: "99,-10402"匹配逻辑
99: 影片必须包含该类型 ID。-10402: 影片不能包含该类型 ID。- 结果: 只有包含类型 99 (纪录片) 且不包含类型 10402 (音乐) 的影片才会被归类到 “纪录片” 目录下。
2. 关键词匹配 (keywords)
允许根据影片标题中的关键词进行精确分类。
配置示例:
哆啦A梦系列:
genre_ids: "16" # 可选,用于限定匹配范围,如动画类型
keywords: "哆啦A梦,机器猫,Doraemon"匹配规则
- 影片标题必须包含
keywords列表中任意一个关键词。 - 关键词匹配不区分大小写。
- 如果标题与所有关键词均不匹配,则跳过该分类规则。
3. 系列化分类 (Series)
匹配成功后,系统会在主分类目录下自动创建与系列相关的子目录,格式为: 分类名称/系列名称系列。
3.1 系列关键词 (series_keywords)
基于影片标题中的关键词创建系列子目录。
配置示例
动画电影:
genre_ids: "16"
series_keywords: "哆啦A梦,海贼王,火影忍者"匹配结果
- 标题含 "哆啦A梦" → 归类到
动画电影/哆啦A梦系列。 - 标题含 "海贼王" → 归类到
动画电影/海贼王系列。 - 仅匹配
genre_ids: "16"但未匹配任何关键词 → 归类到动画电影。
3.2 演员/导演系列 (series_actors / series_directors)
基于影片的主要演员或导演信息创建系列子目录。
配置示例
# 根据演员创建系列
华语电影:
original_language: "zh,cn,bo,za"
series_actors: "周杰伦,周星驰,成龙"
# 根据导演创建系列
国际大片:
series_directors: "克里斯托弗·诺兰,昆汀·塔伦蒂诺"匹配规则
- 系统会检查影片信息中排名前 6 位的演员或导演列表。
- 匹配演员/导演的
name字段。 - 支持中英文姓名,且不区分大小写。
匹配结果
- 《大灌篮》(主演含周杰伦) → 归类到
华语电影/周杰伦系列。 - 《功夫》(主演含周星驰) → 归类到
华语电影/周星驰系列。 - 《盗梦空间》(导演为诺兰) → 归类到
国际大片/克里斯托弗·诺兰系列。
⚡ 重要特性
配置优先级
- 顺序决定一切: 系统会按照您在配置文件中编写的顺序从上到下依次进行匹配。
- 首次匹配即停止: 一旦影片成功匹配某条规则,后续规则将被自动忽略。因此,请务必将更具体、更精确的规则放在配置文件的靠前位置。
匹配逻辑
- 普通字段: 如
genre_ids、original_language等,必须完全满足条件,否则整个规则判定为失败。 - series 字段:
- 纯 series 配置: 如果规则中只包含
series_*字段(如成龙电影),则必须匹配成功,否则规则判定为失败。 - 混合配置: 如果规则中同时包含普通字段和
series_*字段(如动画电影),series_*匹配失败不影响整体规则的匹配,仅表现为不创建系列子目录。
- 纯 series 配置: 如果规则中只包含
数据来源
- 所有匹配判断均基于 TMDB API 返回的标准字段。
- 支持的常用字段包括:
genre_ids、original_language、production_countries、origin_country、title、actors、directors等。
📝 配置建议
- 合理排序: 将最具体的分类规则(如特定系列、导演作品集)放在最前面,将最通用的分类(如按地区、语言分类)放在最后面。
- 测试验证: 新增或修改规则后,建议先用一两个影片进行测试,以验证匹配效果是否符合预期。
- 姓名格式: 配置演员或导演时,建议同时提供其中文名和英文名(如 成龙,Jackie Chan),以最大化提高匹配成功率。
- 关键词选择: 选择具有代表性且不易引发歧义的关键词,避免过于宽泛的词语导致错误分类。
🎯 实际应用示例
以下是一个综合运用了多种功能的完整配置示例,展示了如何通过优先级和规则组合实现精细化分类。
categories:
# 规则一: 具体系列(最高优先级)
# 通过类型、国家和主演精确匹配,创建个人作品系列
哆啦A梦系列:
genre_ids: "16"
origin_country: "JP"
series_actors: "水田山葵,大原惠美"
# 规则二: 导演作品集
# 匹配宫崎骏导演的日本动画,并创建导演系列
宫崎骏动画:
genre_ids: "16"
origin_country: "JP"
series_directors: "宫崎骏"
# 规则三: 排除特定子类型
# 匹配纪录片,但排除其中的音乐纪录片
纪录片:
genre_ids: "99,-10402" # 包含 99 (纪录片),且不包含 10402 (音乐)
# 规则四: 演员系列(中英文名)
# 匹配包含成龙的电影,并创建演员系列
成龙电影:
series_actors: "成龙,Jackie Chan"
# 规则五: 通用分类(最低优先级)
# 作为保底规则,匹配所有未被前面规则命中的日本动画
日本动画:
genre_ids: "16"
origin_country: "JP"