指標の定義: 子育て・教育論議密度
各自治体の議会発言全体に占める「子育て・教育」カテゴリの発言数の割合を「子育て・教育論議密度」として算出します。指標の定義・自治体選定条件・分類モデル仕様・限界・データ提供方法をすべて公開します。

§1. 指標の定義
子育て・教育論議密度 は、各自治体の議会発言全体に占める「子育て・教育」カテゴリの発言数の割合 (%) として定義します。
計算式は以下の通りです。
1.1 12 カテゴリ自動分類モデル
マチカルテでは、議会発言を以下の 12 カテゴリに自動分類するモデルを使用しています。各発言は最も近い 1 カテゴリに分類されます(マルチラベルではありません)。
- 子育て・教育
- 高齢者福祉
- インフラ・防災
- 産業・雇用
- 医療・健康
- 財政・予算
- 議会運営
- 行政組織
- 地域コミュニティ
- 観光・文化
- 環境・エネルギー
- 防犯・治安
1.2 分母の設計
分母を「全発言数」とすることで、議会規模(議員数・開催頻度)の影響を除去します。小規模議会と大規模議会を同一の尺度で比較できます。
§2. 対象自治体の選定
本指標の対象自治体は 238 自治体(全国 1,788 自治体中)です。spec_version: v2-tier1-500threshold-coverage30pct-truedensity。
2.1 選定条件(3 条件すべてを満たす自治体)
- 条件 1: 累計収録発言数 500 件以上(2015 年以降)
- 条件 2: 自動分類カバレッジ 30% 以上(収録発言のうち自動分類が付与された比率)
- 条件 3: 自治体属性登録済み(人口・高齢化率・財政力指数・女性議員比率)
2.2 未対象自治体の扱い
残り 1,335 自治体は現時点で対象外です。分類進捗次第で順次追加します。追加スケジュールは 全自治体カルテ でご確認ください。
§3. 分類モデルの仕様
機械学習ベースの自動分類を採用しています。判定の透明性確保のため、学習データと推論方法を以下に公開します。ソースコードは非公開ですが、再現性のある記述を維持します。
3.1 学習データ
議会発言のうち、手動で 12 カテゴリにアノテーションされたサンプルを学習データとして使用しています。
3.2 推論
各発言を最も近い 1 カテゴリに分類します(マルチラベルではありません)。
3.3 精度の現状
- 全国平均カバレッジ: 24.8%(2026 年 5 月時点)
- 信頼性確保のため、カバレッジ 30% 以上の自治体のみを密度算出の対象とします(§2 条件 2)
§4. 自治体属性の出典
いずれも 2023 年度時点の値を使用しています。
- 人口・高齢化率: 総務省「住民基本台帳に基づく人口、人口動態及び世帯数」(令和 5 年 1 月 1 日現在)+「国勢調査」
- 財政力指数(FPI): 総務省「市町村別決算状況等調」(令和 5 年度)
- 女性議員比率: 各議会の議員名簿(マチカルテ収録)
§5. 限界と注意点
本指標を引用・参照する際は、以下の限界を必ずお読みください。
- 分類精度は 100% ではありません。誤分類による密度の上下動は不可避です。
- 議事録が公開されていない自治体は対象外です。
- 書面会議・紙議会で代替された発言は含まれない場合があります。
- 委員長報告・採決等の機械的発言は除外しています。
- 発言長 50 文字以上を対象としています(短い形式的発言を除外するため)。
- 外れ値(紋別市 0.31% など)はデータの妥当性を継続検証中です。
§6. データ提供と訂正
- データセット CSV ダウンロード: /developers
- 訂正申し立て: /reports/errata#form
- 引用テンプレ: /press#citation
- ライセンス: CC BY 4.0
出典: マチカルテ(一般社団法人社会構想デザイン機構)/ spec_version v2-tier1-500threshold-coverage30pct-truedensity