如何在Python中筛选JSON数组中非空source字段对应的数据

如何在Python中筛选JSON数组中非空source字段对应的数据

本文介绍如何使用python解析json数据,遍历嵌套数组,精准筛选出”source”字段非空(即包含至少一个对象)的条目,并提取其operation_no等关键值。

在处理结构化JSON数据时,常需根据特定字段(如 “source”)的有无或内容进行条件过滤。本例中,目标是从顶层键 “L” 对应的列表中,仅提取那些 “source” 字段为非空列表(即长度 > 0)的对象,并获取其 “operation_no” 值。

核心逻辑在于:

  • 使用 json.loads() 解析JSON字符串为Python字典;
  • 安全访问嵌套结构:用 .get(“L”, []) 防止键不存在报错;
  • 判断 “source” 是否为真值且非空列表:d.get(“source”) 在空列表 [] 时返回 False,在含元素的列表时返回 True,天然满足“非空”语义;
  • 结合海象运算符 :=(Python 3.8+)实现简洁赋值与判断。

以下是完整可运行示例:

import json

# 示例JSON字符串(实际中可能来自文件或API响应)
json_str = '''{
    "L": [
        {
            "operation_no": 123456,
            "key1": "value1",
            "keys": {"no_seq": "1234", "external_key": null},
            "key2": 10234,
            "territory": {"territory_no": 1},
            "key3": "value",
            "source": []
        },
        {
            "operation_no": 123458,
            "key1": "value3",
            "keys": {"no_seq": "1237", "external_key": null},
            "key2": 10237,
            "territory": {"territory_no": 1},
            "key3": "value",
            "source": [
                {"source1": "fhry4645fsgaa1", "source2": "123egst36535a1"},
                {"source1": "fhry4645fsgaa2", "source2": "123egst36535a2"}
            ]
        }
    ]
}'''

# 解析JSON
data = json.loads(json_str)

# 筛选并提取operation_no(仅当source非空时)
results = []
for item in data.get("L", []):
    source_data = item.get("source")
    if source_data:  # 空列表[]为False,非空列表为True
        op_no = item.get("operation_no")
        if op_no is not None:
            results.append(op_no)
            print(f"Found operation_no: {op_no}")

print(f"/nAll matched operation_no values: {results}")

输出结果:

LobeHub

LobeHub

LobeChat brings you the best user experience of ChatGPT, OLLaMA, Gemini, Claude

下载

立即学习Python免费学习笔记(深入)”;

Found operation_no: 123458

All matched operation_no values: [123458]

注意事项:

  • d.get(“source”) 是安全写法,若键不存在则返回 None(也为 False),避免 KeyError;
  • 不要误用 if len(d.get(“source”, [])) > 0 —— 虽然功能等价,但 if d.get(“source”) 更简洁、符合Python惯用法;
  • 若需进一步处理 source 中的子项(如提取所有 source1 值),可在 if source_data: 块内遍历 source_data;
  • 如需兼容旧版Python(

该方法高效、健壮,适用于日志分析、API响应清洗、配置校验等多种JSON数据预处理场景。

https://www.php.cn/faq/1998704.html

发表回复

Your email address will not be published. Required fields are marked *