Initial clean commit

2026-03-17 11:52:27 +01:00 · 2026-03-17 11:52:27 +01:00 · f984bc4cf8
commit f984bc4cf8
9 changed files with 2734 additions and 0 deletions
--- a/.gitignore
+++ b/.gitignore
@ -0,0 +1,14 @@
 data/
 *.parquet
 *.xlsx
 *.pdf
 .venv/
 node_modules/
 .DS_Store
 latex/*.pdf
 *.log
 data/
 *.parquet
 *.xlsx
 latex/
 latex/*.pdf
--- a/README.md
+++ b/README.md
@ -0,0 +1,2 @@
 # LEAG-COALLOG
--- a/src/optimization/init.py
+++ b/src/optimization/init.py
@ -0,0 +1,3 @@
 from .model_builder import build_model, load_tables, solve_model
 __all__ = ["build_model", "load_tables", "solve_model"]
--- a/src/optimization/pycache/init.cpython-313.pyc
+++ b/src/optimization/pycache/init.cpython-313.pyc
--- a/src/optimization/pycache/model_builder.cpython-313.pyc
+++ b/src/optimization/pycache/model_builder.cpython-313.pyc
--- a/src/optimization/pycache/run_optimization.cpython-313.pyc
+++ b/src/optimization/pycache/run_optimization.cpython-313.pyc
--- a/src/optimization/model_builder.py
+++ b/src/optimization/model_builder.py
--- a/src/optimization/run_optimization.py
+++ b/src/optimization/run_optimization.py
@ -0,0 +1,731 @@
 from __future__ import annotations
 import argparse
 import sys
 from pathlib import Path
 import pandas as pd
 import pyomo.environ as pyo
 from pyomo.environ import value
 SRC_ROOT = Path(__file__).resolve().parents[1]
 if str(SRC_ROOT) not in sys.path:
    sys.path.insert(0, str(SRC_ROOT))
 from optimization.model_builder import build_model, load_tables, solve_model
 def report_results(model: pyo.ConcreteModel, max_rows: int) -> None:
    print("Objective value:", value(model.obj))
    print("Non-zero production decisions (k):")
    printed = 0
    for i in model.I:
        for j in model.J:
            for w in model.W:
                for d in model.D:
                    for s in model.S:
                        qty = value(model.k[i, j, w, d, s])
                        if qty > 1e-6:
                            print(f"  {i} -> {j} (W{w} D{d} S{s}): {qty:.0f}")
                            printed += 1
                            if printed >= max_rows:
                                print("  ... output truncated ...")
                                return
 def export_results(model: pyo.ConcreteModel, output_path: Path) -> None:
    output_path.parent.mkdir(parents=True, exist_ok=True)
    wd_to_date = getattr(model, "_wd_to_date", {})
    def safe_value(var) -> float:
        val = pyo.value(var, exception=False)
        return float(val) if val is not None else 0.0
    def autosize_worksheet(ws, df, index_cols=None, max_width=25):
        if index_cols is None:
            index_cols = list(df.index.names)
        idx_names = list(index_cols)
        col_widths = [max(10, max(len(str(n)) for n in idx_names if n is not None) + 2) if idx_names else 10]
        for col_idx, col in enumerate(df.columns):
            header = " / ".join([str(c) for c in col]) if isinstance(col, tuple) else str(col)
            max_len = max(len(header), 8)
            sample = df.iloc[:200, col_idx]
            max_len = max(max_len, sample.astype(str).str.len().max())
            col_widths.append(min(max_width, int(max_len) + 2))
        return col_widths
    def adjust_widths_for_labels(df, widths, label_scale, index_scale=None):
        adjusted = widths[:]
        if index_scale is not None and adjusted:
            adjusted[0] = max(10, int(adjusted[0] * index_scale))
        if hasattr(df.columns, "get_level_values"):
            top_level = df.columns.get_level_values(0)
            for idx, label in enumerate(top_level, start=1):
                if label in label_scale:
                    adjusted[idx] = max(6, int(adjusted[idx] * label_scale[label]))
        return adjusted
    lieferungen_schicht = []
    for j in model.J:
        for w in model.W:
            for d in model.D:
                for s in model.S:
                    if j == "V":
                        nachfrage = pyo.value(model.dV_N[w, d] + model.dV_W[w, d])
                    else:
                        nachfrage = pyo.value(model.d[j, w, d])
                    use_bunker_out = hasattr(model, "bunker_out") and j in getattr(model, "J_BUNKER", [])
                    delivery_sum = sum(safe_value(model.x[i, j, w, d, s]) for i in model.I)
                    out_sum = (
                        sum(safe_value(model.bunker_out[i, j, w, d, s]) for i in model.I)
                        if use_bunker_out
                        else delivery_sum
                    )
                    bunker_inflow = 0.0
                    if use_bunker_out:
                        x_sum = sum(safe_value(model.x[i, j, w, d, s]) for i in model.I)
                        out_sum = sum(safe_value(model.bunker_out[i, j, w, d, s]) for i in model.I)
                        bunker_inflow = round(x_sum - out_sum, 2)
                    def flow_val(i_name: str) -> float:
                        return safe_value(model.x[i_name, j, w, d, s])
                    lieferungen_schicht.append(
                        {
                            "kraftwerk": j,
                            "woche": w,
                            "tag": d,
                            "datum": wd_to_date.get((w, d)),
                            "schicht": s,
                            "nachfrage_tonnen": nachfrage,
                            "lieferung_tonnen": delivery_sum,
                            "lieferungsabweichung_tonnen": round(delivery_sum - nachfrage, 2),
                            "bunkerzufluss_tonnen": bunker_inflow,
                            "Nochten": flow_val("Nochten"),
                            "Reichwalde": flow_val("Reichwalde"),
                            "Welzow": flow_val("Welzow"),
                        }
                    )
    order_k_pw = ["J", "SP", "B3", "B4"]
    order_k_v = ["V"]
    order_sources = ["Reichwalde", "Nochten", "Welzow"]
    order_s = ["F", "S", "N"]
    df_raw = pd.DataFrame(lieferungen_schicht).copy()
    df_raw["datum"] = pd.to_datetime(df_raw["datum"])
    v_demand_map = {
        (int(w), d): {
            "welzow": float(pyo.value(model.dV_W[w, d])),
            "nochten": float(pyo.value(model.dV_N[w, d])),
        }
        for w in model.W
        for d in model.D
    }
    df_raw["nachfrage_welzow"] = df_raw.get("nachfrage_welzow", pd.Series(index=df_raw.index))
    df_raw["nachfrage_nochten"] = df_raw.get("nachfrage_nochten", pd.Series(index=df_raw.index))
    df_raw["nachfrage_welzow"] = df_raw.apply(
        lambda r: (
            r["nachfrage_welzow"]
            if pd.notna(r["nachfrage_welzow"])
            else v_demand_map.get((int(r["woche"]), r["tag"]), {}).get("welzow", 0)
        ),
        axis=1,
    )
    df_raw["nachfrage_nochten"] = df_raw.apply(
        lambda r: (
            r["nachfrage_nochten"]
            if pd.notna(r["nachfrage_nochten"])
            else v_demand_map.get((int(r["woche"]), r["tag"]), {}).get("nochten", 0)
        ),
        axis=1,
    )
    df = df_raw.rename(columns={"lieferungen_tonnen": "lieferung_tonnen"}).copy()
    if "lieferung_tonnen" not in df.columns:
        df["lieferung_tonnen"] = df[order_sources].sum(axis=1)
    present_sources = [c for c in order_sources if c in df.columns]
    df_src = (
        df.pivot_table(
            index=["datum", "woche", "tag"],
            columns=["kraftwerk", "schicht"],
            values=present_sources,
            aggfunc="sum",
        )
        .fillna(0)
    )
    df_src.columns = df_src.columns.reorder_levels([1, 0, 2])
    df_src = df_src.reindex(
        columns=pd.MultiIndex.from_product([order_k_pw + order_k_v, present_sources, order_s]),
        fill_value=0,
    )
    df_demand = (
        df.groupby(["datum", "woche", "tag", "kraftwerk"])["nachfrage_tonnen"]
        .first()
        .unstack("kraftwerk")
        .reindex(columns=order_k_pw + order_k_v, fill_value=0)
        .reindex(df_src.index, fill_value=0)
    )
    df_v_demand_split = (
        df[df["kraftwerk"] == "V"]
        .groupby(["datum", "woche", "tag"])[["nachfrage_welzow", "nachfrage_nochten"]]
        .first()
        .reindex(df_src.index, fill_value=0)
    )
    totals_plain = df_src.T.groupby(level=0).sum().T
    totals_plain = totals_plain.reindex(columns=order_k_pw + order_k_v, fill_value=0)
    day_diff_rows = []
    for w in model.W:
        for d in model.D:
            date = wd_to_date.get((w, d))
            if date is None:
                continue
            row = {"datum": date, "woche": w, "tag": d}
            for j in order_k_pw + order_k_v:
                if j == "V":
                    demand = pyo.value(model.dV_N[w, d] + model.dV_W[w, d])
                else:
                    demand = pyo.value(model.d[j, w, d])
                delivered = pyo.value(model.y_delivery[j, w, d])
                row[j] = delivered - demand
            day_diff_rows.append(row)
    day_diff_plain = (
        pd.DataFrame(day_diff_rows)
        .set_index(["datum", "woche", "tag"])
        .reindex(totals_plain.index, fill_value=0)
        .reindex(columns=order_k_pw + order_k_v, fill_value=0)
    )
    totals = totals_plain.copy()
    totals.columns = pd.MultiIndex.from_tuples([(k, "Gesamt", "") for k in totals.columns])
    demand_cols = df_demand.copy()
    demand_cols.columns = pd.MultiIndex.from_tuples([(k, "Nachfrage", "") for k in demand_cols.columns])
    day_diff_cols = day_diff_plain.copy()
    day_diff_cols.columns = pd.MultiIndex.from_tuples(
        [(k, "Lieferungstagesabweichung", "") for k in day_diff_cols.columns]
    )
    v_demand_cols = df_v_demand_split.copy()
    v_demand_cols.columns = pd.MultiIndex.from_tuples(
        [
            ("V", "Nachfrage_Welzow", ""),
            ("V", "Nachfrage_Nochtener", ""),
        ]
    )
    has_bunker = hasattr(model, "bunker")
    col_order = []
    for k in order_k_pw:
        for src in present_sources:
            for sch in order_s:
                col_order.append((k, src, sch))
        col_order.append((k, "Gesamt", ""))
        col_order.append((k, "Nachfrage", ""))
        col_order.append((k, "Lieferungstagesabweichung", ""))
    col_order += [( "V", src, sch) for src in present_sources for sch in order_s]
    col_order += [
        ("V", "Nachfrage_Welzow", ""),
        ("V", "Nachfrage_Nochtener", ""),
        ("V", "Gesamt", ""),
        ("V", "Nachfrage", ""),
        ("V", "Lieferungstagesabweichung", ""),
    ]
    df_out = pd.concat([df_src, v_demand_cols, totals, demand_cols, day_diff_cols], axis=1)
    df_out = df_out.reindex(
        columns=col_order,
        fill_value=0,
    )
    weekday_order = ["Mo", "Di", "Mi", "Do", "Fr", "Sa", "So"]
    idx = df_out.index
    df_out = df_out.copy()
    df_out.index = pd.MultiIndex.from_arrays(
        [
            pd.to_datetime(idx.get_level_values("datum")),
            idx.get_level_values("woche"),
            pd.Categorical(idx.get_level_values("tag"), categories=weekday_order, ordered=True),
        ],
        names=["datum", "woche", "tag"],
    )
    df_out = df_out.sort_index(level=["datum", "woche", "tag"])
    df = df_out.copy()
    df_out = df_out / 1000
    bunker_sheet = None
    if has_bunker:
        bunker_rows = []
        for j in getattr(model, "J_BUNKER", []):
            for w in model.W:
                for d in model.D:
                    date = wd_to_date.get((w, d))
                    if date is None:
                        continue
                    bunker_total = sum(safe_value(model.bunker[i, j, w, d]) for i in model.I)
                    bunker_rows.append(
                        {
                            "kraftwerk": j,
                            "woche": w,
                            "tag": d,
                            "datum": date,
                            "bunkerbestand_tonnen": bunker_total,
                        }
                    )
        if bunker_rows:
            bunker_df = pd.DataFrame(bunker_rows)
            bunker_df["datum"] = pd.to_datetime(bunker_df["datum"])
            bunker_df = bunker_df.sort_values(["kraftwerk", "datum", "woche", "tag"])
            bunker_df["vortags_bunkerbestand_tonnen"] = bunker_df.groupby("kraftwerk")[
                "bunkerbestand_tonnen"
            ].shift(1)
            bunker_df["vortags_bunkerbestand_tonnen"] = bunker_df["vortags_bunkerbestand_tonnen"].fillna(0)
            bunker_pivot = (
                bunker_df.pivot_table(
                    index=["datum", "woche", "tag"],
                    columns=["kraftwerk"],
                    values=["bunkerbestand_tonnen"],
                    aggfunc="first",
                )
                .fillna(0)
            )
            bunker_pivot = bunker_pivot.reindex(columns=order_k_pw + order_k_v, level=1, fill_value=0)
            bunker_pivot.columns = pd.MultiIndex.from_tuples(
                [(k, "Bunkerbestand", "") for k in bunker_pivot.columns.get_level_values(1)]
            )
            bunker_prev_pivot = (
                bunker_df.pivot_table(
                    index=["datum", "woche", "tag"],
                    columns=["kraftwerk"],
                    values=["vortags_bunkerbestand_tonnen"],
                    aggfunc="first",
                )
                .fillna(0)
            )
            bunker_prev_pivot = bunker_prev_pivot.reindex(columns=order_k_pw + order_k_v, level=1, fill_value=0)
            bunker_prev_pivot.columns = pd.MultiIndex.from_tuples(
                [(k, "Vortags_Bunkerbestand", "") for k in bunker_prev_pivot.columns.get_level_values(1)]
            )
            inflow_pivot = None
            if "bunkerzufluss_tonnen" in df_raw.columns:
                inflow_pivot = (
                    df_raw.pivot_table(
                        index=["datum", "woche", "tag"],
                        columns=["kraftwerk"],
                        values=["bunkerzufluss_tonnen"],
                        aggfunc="sum",
                    )
                    .fillna(0)
                )
                inflow_pivot.columns = pd.MultiIndex.from_tuples(
                    [(k, "Bunkerzufluss", "") for k in inflow_pivot.columns.get_level_values(1)]
                )
            frames = [df]
            frames.append(bunker_prev_pivot.reindex(df.index, fill_value=0))
            if inflow_pivot is not None:
                frames.append(inflow_pivot.reindex(df.index, fill_value=0))
            frames.append(bunker_pivot.reindex(df.index, fill_value=0))
            bunker_sheet = pd.concat(frames, axis=1)
            col_order_bunker = []
            for k in order_k_pw:
                for src in present_sources:
                    for sch in order_s:
                        col_order_bunker.append((k, src, sch))
                col_order_bunker.append((k, "Gesamt", ""))
                col_order_bunker.append((k, "Nachfrage", ""))
                col_order_bunker.append((k, "Lieferungstagesabweichung", ""))
                if (k, "Vortags_Bunkerbestand", "") in bunker_sheet.columns:
                    col_order_bunker.append((k, "Vortags_Bunkerbestand", ""))
                if (k, "Bunkerzufluss", "") in bunker_sheet.columns:
                    col_order_bunker.append((k, "Bunkerzufluss", ""))
                if (k, "Bunkerbestand", "") in bunker_sheet.columns:
                    col_order_bunker.append((k, "Bunkerbestand", ""))
            col_order_bunker += [("V", src, sch) for src in present_sources for sch in order_s]
            col_order_bunker += [
                ("V", "Nachfrage_Welzow", ""),
                ("V", "Nachfrage_Nochtener", ""),
                ("V", "Gesamt", ""),
                ("V", "Nachfrage", ""),
                ("V", "Lieferungstagesabweichung", ""),
            ]
            if ("V", "Vortags_Bunkerbestand", "") in bunker_sheet.columns:
                col_order_bunker.append(("V", "Vortags_Bunkerbestand", ""))
            if ("V", "Bunkerzufluss", "") in bunker_sheet.columns:
                col_order_bunker.append(("V", "Bunkerzufluss", ""))
            if ("V", "Bunkerbestand", "") in bunker_sheet.columns:
                col_order_bunker.append(("V", "Bunkerbestand", ""))
            bunker_sheet = bunker_sheet.reindex(columns=col_order_bunker, fill_value=0)
    try:
        import xlsxwriter  # type: ignore
        excel_engine = "xlsxwriter"
    except Exception:
        excel_engine = "openpyxl"
    with pd.ExcelWriter(output_path, engine=excel_engine) as writer:
        df.to_excel(writer, sheet_name="Sheet1")
        if excel_engine == "xlsxwriter":
            ws1 = writer.sheets["Sheet1"]
            widths = autosize_worksheet(ws1, df)
            widths = adjust_widths_for_labels(
                df,
                widths,
                {
                    "Reichwalde": 0.5,
                    "Nochten": 0.5,
                    "Welzow": 0.5,
                    "Gesamt": 0.5,
                    "Nachfrage": 0.5,
                    "Bunkerbestand": 0.5,
                    "Bunkerzufluss": 0.5,
                    "Vortags_Bunkerbestand": 0.5,
                },
                index_scale=1.2,
            )
            for i, w in enumerate(widths):
                ws1.set_column(i, i, w)
        else:
            ws1 = writer.sheets["Sheet1"]
            widths = autosize_worksheet(ws1, df)
            widths = adjust_widths_for_labels(
                df,
                widths,
                {
                    "Reichwalde": 0.5,
                    "Nochten": 0.5,
                    "Welzow": 0.5,
                    "Gesamt": 0.5,
                    "Nachfrage": 0.5,
                    "Bunkerbestand": 0.5,
                    "Bunkerzufluss": 0.5,
                    "Vortags_Bunkerbestand": 0.5,
                },
                index_scale=1.2,
            )
            for i, w in enumerate(widths):
                ws1.column_dimensions[chr(65 + i)].width = w
        if bunker_sheet is not None:
            bunker_sheet.to_excel(writer, sheet_name="mit_Bunkerbestand")
            if excel_engine == "xlsxwriter":
                workbook = writer.book
                worksheet = writer.sheets["mit_Bunkerbestand"]
                widths = autosize_worksheet(worksheet, bunker_sheet)
                widths = adjust_widths_for_labels(
                    bunker_sheet,
                    widths,
                    {
                        "Reichwalde": 0.5,
                        "Nochten": 0.5,
                        "Welzow": 0.5,
                        "Gesamt": 0.5,
                        "Nachfrage": 0.5,
                        "Bunkerbestand": 0.5,
                        "Bunkerzufluss": 0.5,
                        "Vortags_Bunkerbestand": 0.5,
                    },
                    index_scale=1.2,
                )
                for i, w in enumerate(widths):
                    worksheet.set_column(i, i, w)
                header_fmt = workbook.add_format({"bold": True, "bg_color": "#E6E6E6", "border": 1})
                block_colors = ["#DCEFFE", "#FDEBD0", "#E8F8F5", "#FADBD8", "#E8DAEF", "#FEF9E7"]
                block_formats = [
                    workbook.add_format({"bold": True, "bg_color": color, "border": 1}) for color in block_colors
                ]
                index_cols = len(bunker_sheet.index.names)
                n_header_rows = bunker_sheet.columns.nlevels
                # Base header formatting for index columns.
                for r in range(n_header_rows):
                    for c in range(index_cols):
                        worksheet.write(r, c, "", header_fmt)
                # Apply block colors per Kraftwerk on header rows.
                top_level = bunker_sheet.columns.get_level_values(0)
                blocks = {}
                for idx, label in enumerate(top_level):
                    blocks.setdefault(label, []).append(idx)
                for b_idx, (label, cols) in enumerate(blocks.items()):
                    fmt = block_formats[b_idx % len(block_formats)]
                    for r in range(n_header_rows):
                        for c in cols:
                            value = bunker_sheet.columns.get_level_values(r)[c]
                            worksheet.write(r, index_cols + c, value, fmt)
            else:
                from openpyxl.styles import Border, Font, PatternFill, Side
                worksheet = writer.sheets["mit_Bunkerbestand"]
                widths = autosize_worksheet(worksheet, bunker_sheet)
                widths = adjust_widths_for_labels(
                    bunker_sheet,
                    widths,
                    {
                        "Reichwalde": 0.5,
                        "Nochten": 0.5,
                        "Welzow": 0.5,
                        "Gesamt": 0.5,
                        "Nachfrage": 0.5,
                        "Bunkerbestand": 0.5,
                        "Bunkerzufluss": 0.5,
                        "Vortags_Bunkerbestand": 0.5,
                    },
                    index_scale=1.2,
                )
                for i, w in enumerate(widths):
                    worksheet.column_dimensions[chr(65 + i)].width = w
                header_fill = PatternFill("solid", fgColor="E6E6E6")
                block_colors = ["DCEFFE", "FDEBD0", "E8F8F5", "FADBD8", "E8DAEF", "FEF9E7"]
                block_fills = [PatternFill("solid", fgColor=c) for c in block_colors]
                bold_font = Font(bold=True)
                border = Border(
                    left=Side(style="thin"),
                    right=Side(style="thin"),
                    top=Side(style="thin"),
                    bottom=Side(style="thin"),
                )
                index_cols = len(bunker_sheet.index.names)
                n_header_rows = bunker_sheet.columns.nlevels
                top_level = bunker_sheet.columns.get_level_values(0)
                blocks = {}
                for idx, label in enumerate(top_level):
                    blocks.setdefault(label, []).append(idx)
                for r in range(n_header_rows):
                    for c in range(index_cols):
                        cell = worksheet.cell(row=r + 1, column=c + 1)
                        cell.fill = header_fill
                        cell.font = bold_font
                        cell.border = border
                for b_idx, (label, cols) in enumerate(blocks.items()):
                    fill = block_fills[b_idx % len(block_fills)]
                    for r in range(n_header_rows):
                        for c in cols:
                            cell = worksheet.cell(row=r + 1, column=index_cols + c + 1)
                            cell.fill = fill
                            cell.font = bold_font
                            cell.border = border
        # Kohlesorten-Mischverhaeltnis (gesamter Zeitraum)
        j_name_map = {
            "J": "Jänschwalde",
            "SP": "Schwarze Pumpe",
            "B3": "Boxberg Werk 3",
            "B4": "Boxberg Werk 4",
        }
        i_name_map = {
            "Reichwalde": "Reichwalder-Kohle",
            "Nochten": "Nochtener-Kohle",
            "Welzow": "Welzower-Kohle",
        }
        # Empirical mix over full horizon based on delivered quantities (x).
        total_delivered_by_j = {}
        for j_code in j_name_map:
            if j_code not in model.J:
                continue
            total_delivered_by_j[j_code] = sum(
                safe_value(model.x[i, j_code, w, d, s])
                for i in model.I
                for w in model.W
                for d in model.D
                for s in model.S
                if (i, j_code, w, d, s) in model.x
            )
        # Empirical bunker mix over full horizon based on bunker stock.
        total_bunker_by_j = {}
        if hasattr(model, "bunker"):
            for j_code in j_name_map:
                if j_code not in getattr(model, "J_BUNKER", []):
                    continue
                total_bunker_by_j[j_code] = sum(
                    safe_value(model.bunker[i, j_code, w, d])
                    for i in model.I
                    for w in model.W
                    for d in model.D
                    if (i, j_code, w, d) in model.bunker
                )
        mix_rows = []
        for j_code, j_name in j_name_map.items():
            if j_code not in model.J:
                continue
            for i_code, i_name in i_name_map.items():
                if i_code not in model.I:
                    continue
                denom = total_delivered_by_j.get(j_code, 0.0)
                num = sum(
                    safe_value(model.x[i_code, j_code, w, d, s])
                    for w in model.W
                    for d in model.D
                    for s in model.S
                    if (i_code, j_code, w, d, s) in model.x
                )
                empirisch = round(100 * num / denom, 2) if denom > 0 else 0.0
                bunker_empirisch = 0.0
                if hasattr(model, "bunker") and j_code in total_bunker_by_j:
                    denom_b = total_bunker_by_j.get(j_code, 0.0)
                    num_b = sum(
                        safe_value(model.bunker[i_code, j_code, w, d])
                        for w in model.W
                        for d in model.D
                        if (i_code, j_code, w, d) in model.bunker
                    )
                    bunker_empirisch = round(100 * num_b / denom_b, 2) if denom_b > 0 else 0.0
                mix_rows.append(
                    {
                        "kraftwerk": j_name,
                        "kohlesorte": i_name,
                        "ziel_low": round(100 * pyo.value(model.alpha_target_low[i_code, j_code]), 2),
                        "ziel_high": round(100 * pyo.value(model.alpha_target_high[i_code, j_code]), 2),
                        "maximal": round(100 * pyo.value(model.alpha_max[i_code, j_code]), 2),
                        "minimal": round(100 * pyo.value(model.alpha_min[i_code, j_code]), 2),
                        "empirisch": empirisch,
                        "bunker_empirisch": bunker_empirisch,
                    }
                )
        mix_df = pd.DataFrame(mix_rows)
        mix_df.to_excel(writer, sheet_name="Kohlemischverhältnis", index=False)
        if excel_engine == "xlsxwriter":
            ws_mix = writer.sheets["Kohlemischverhältnis"]
            workbook = writer.book
            mix_block_colors = ["#E8F8F5", "#FDEBD0", "#DCEFFE", "#FADBD8"]
            mix_formats = [workbook.add_format({"bg_color": c}) for c in mix_block_colors]
            red_fill = workbook.add_format({"bg_color": "#F5B7B1"})
            green_fill = workbook.add_format({"bg_color": "#D4EFDF"})
            if not mix_df.empty:
                emp_col = mix_df.columns.get_loc("empirisch")
                bunker_emp_col = mix_df.columns.get_loc("bunker_empirisch")
                current = None
                block_idx = -1
                for r, row in mix_df.iterrows():
                    if row["kraftwerk"] != current:
                        block_idx += 1
                        current = row["kraftwerk"]
                    fmt = mix_formats[block_idx % len(mix_formats)]
                    for c in range(0, min(6, mix_df.shape[1])):
                        ws_mix.write(r + 1, c, row.iloc[c], fmt)
                    emp_fmt = (
                        red_fill
                        if row["empirisch"] < row["ziel_low"] or row["empirisch"] > row["ziel_high"]
                        else green_fill
                    )
                    ws_mix.write(r + 1, emp_col, row["empirisch"], emp_fmt)
                    ws_mix.write(r + 1, bunker_emp_col, row["bunker_empirisch"])
            widths = autosize_worksheet(ws_mix, mix_df, index_cols=[])
            for i, w in enumerate(widths[1:]):
                ws_mix.set_column(i, i, w)
        else:
            ws_mix = writer.sheets["Kohlemischverhältnis"]
            if not mix_df.empty:
                from openpyxl.styles import PatternFill
                mix_block_colors = ["E8F8F5", "FDEBD0", "DCEFFE", "FADBD8"]
                mix_fills = [PatternFill("solid", fgColor=c) for c in mix_block_colors]
                red_fill = PatternFill("solid", fgColor="F5B7B1")
                green_fill = PatternFill("solid", fgColor="D4EFDF")
                current = None
                block_idx = -1
                for row_idx, kraftwerk in enumerate(mix_df["kraftwerk"], start=2):
                    if kraftwerk != current:
                        block_idx += 1
                        current = kraftwerk
                    fill = mix_fills[block_idx % len(mix_fills)]
                    for col_idx in range(1, min(7, mix_df.shape[1]) + 1):
                        ws_mix.cell(row=row_idx, column=col_idx).fill = fill
                emp_col = mix_df.columns.get_loc("empirisch") + 1
                bunker_emp_col = mix_df.columns.get_loc("bunker_empirisch") + 1
                for r, row in mix_df.iterrows():
                    fill = red_fill if row["empirisch"] < row["ziel_low"] or row["empirisch"] > row["ziel_high"] else green_fill
                    ws_mix.cell(row=r + 2, column=emp_col).fill = fill
                    # No group fill for bunker_empirisch (column H).
            widths = autosize_worksheet(ws_mix, mix_df, index_cols=[])
            for i, w in enumerate(widths[1:]):
                ws_mix.column_dimensions[chr(65 + i)].width = w
 def main() -> None:
    parser = argparse.ArgumentParser(description="Run the Pyomo optimization model.")
    parser.add_argument(
        "--data-dir",
        type=Path,
        default=Path("data/processed"),
        help="Directory containing input parquet files.",
    )
    parser.add_argument(
        "--solver",
        default="gurobi",
        help="Solver name passed to Pyomo (default: gurobi).",
    )
    parser.add_argument(
        "--max-rows",
        type=int,
        default=50,
        help="Maximum number of non-zero decision variable rows to print.",
    )
    parser.add_argument(
        "--time-limit",
        type=int,
        default=600,
        help="Time limit (seconds) for the solver (default: 600).",
    )
    parser.add_argument(
        "--output-xlsx",
        type=Path,
        default=Path("data/out/output.xlsx"),
        help="Excel output file for deliveries by plant/week/day/shift.",
    )
    parser.add_argument(
        "--mip-gap",
        type=float,
        default=0.03,
        help="MIP gap tolerance (default: 0.03).",
    )
    parser.add_argument(
        "--step-size-tonnes",
        type=int,
        default=1000,
        choices=[960, 1000],
        help="Discrete train step size in tonnes (default: 1000).",
    )
    args = parser.parse_args()
    tables = load_tables(args.data_dir)
    model = build_model(tables, step_size_tonnes=args.step_size_tonnes)
    solve_model(model, args.solver, args.time_limit, args.mip_gap)
    # report_results(model, args.max_rows)
    export_results(model, args.output_xlsx)
 if __name__ == "__main__":
    main()
 # uv run python src/optimization/run_optimization.py --solver gurobi --mip-gap 0.05
 # uv run python src/optimization/run_optimization.py --solver highs
--- a/src/preprocessing/exploration_preprocess.py
+++ b/src/preprocessing/exploration_preprocess.py
@ -0,0 +1,505 @@
 # Generated from exploration.ipynb
 # %%
 import os
 from pathlib import Path
 import numpy as np
 import pandas as pd
 # %%
 PROJECT_ROOT = Path(__file__).resolve().parents[2]
 DEFAULT_INPUT = PROJECT_ROOT / "data/input/PoC1_Rohkohleverteilung_Input_Parameter.xlsx"
 DEFAULT_OUTPUT = PROJECT_ROOT / "data/processed"
 INPUT_XLSX = Path(os.environ.get("POC1_INPUT_XLSX", str(DEFAULT_INPUT)))
 OUTPUT_DIR = Path(os.environ.get("POC1_OUTPUT_DIR", str(DEFAULT_OUTPUT)))
 OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
 path = INPUT_XLSX
 # %% [markdown]
 # # Mappe Parameter
 # %% [markdown]
 # ## Erlaubte Abweichung
 # ### Kraftwerke
 # %%
 raw = pd.read_excel(path, sheet_name="Parameter", header=None)
 t1 = raw.iloc[0:18, 0:8].copy()
 # 1. komplett leere Zeilen raus
 df = t1.dropna(how="all").reset_index(drop=True)
 # 2. Einheitenzeile und Labelzeile identifizieren
 unit_idx = df[df.apply(lambda r: r.astype(str).str.contains(r"\[kt\]").any(), axis=1)].index[0]
 label_idx = unit_idx + 1
 unit_row = df.loc[unit_idx]
 label_row = df.loc[label_idx]
 # 3. Spaltennamen bauen
 headers = []
 for u, l in zip(unit_row, label_row):
    if pd.isna(l):
        headers.append(str(u))
    elif pd.isna(u):
        headers.append(str(l))
    else:
        headers.append(f"{l} ({u})")
 # 4. Daten unterhalb der Headerzeilen
 data = df.loc[label_idx+1:].reset_index(drop=True)
 data.columns = headers
 # Neue Kopie mit eindeutigen Spaltennamen
 data2 = data.copy()
 data2.columns = [
    "col0",
    "titel",
    "col2",
    "zeitraum",
    "minus_kt",
    "plus_kt",
    "minus_pct",
    "plus_pct",
 ]
 # Titelzeilen entfernen
 mask_title = data2["titel"].isin([
    "Erlaubte Abweichungen der Bedarfserfüllung",
    "Kraftwerk",
    "Kraftwerke",
    "Veredlung ISP"
 ])
 data3 = data2[~mask_title].reset_index(drop=True)
 # kraftwerk steht in col2, nach unten füllen
 data3["kraftwerk"] = data3["col2"].ffill()
 # Zeilen ohne Zeitraum entfernen
 data3 = data3.dropna(subset=["zeitraum"]).reset_index(drop=True)
 # numerische Spalten konvertieren
 for col in ["minus_kt", "plus_kt", "minus_pct", "plus_pct"]:
    data3[col] = pd.to_numeric(data3[col], errors="coerce")
 # Endauswahl
 result = data3[["kraftwerk", "zeitraum", "minus_kt", "plus_kt", "minus_pct", "plus_pct"]]
 data3 = data2.copy()
 data3["kraftwerk"] = data3["col2"].ffill()
 data3 = data3.dropna(subset=["zeitraum"]).reset_index(drop=True)
 for col in ["minus_kt", "plus_kt", "minus_pct", "plus_pct"]:
    data3[col] = pd.to_numeric(data3[col], errors="coerce")
 bounds_power_plants = data3[["kraftwerk", "zeitraum", "minus_kt", "plus_kt", "minus_pct", "plus_pct"]]
 bounds_power_plants[["minus"]] = bounds_power_plants[["minus_kt"]]*1000
 bounds_power_plants[["plus"]] = bounds_power_plants[["plus_kt"]]*1000
 bounds_power_plants.drop(columns=["minus_kt", "plus_kt"],inplace=True)
 bounds_power_plants.to_parquet(OUTPUT_DIR / "bounds_power_plants.parquet")
 print("Saved bounds_power_plants.parquet")
 bounds_power_plants
 # %% [markdown]
 # ### Veredlung
 # %%
 raw = pd.read_excel(path, sheet_name="Parameter", header=None)
 t1_upper = raw.iloc[0:4, 0:8].copy()
 t1_upper
 t2 = raw.iloc[18:28, 0:8].copy()
 t2 = pd.concat([t1_upper,t2], axis=0)
 # 1. komplett leere Zeilen raus
 df = t2.dropna(how="all").reset_index(drop=True)
 # 2. Einheitenzeile und Labelzeile identifizieren
 unit_idx = df[df.apply(lambda r: r.astype(str).str.contains(r"\[kt\]").any(), axis=1)].index[0]
 label_idx = unit_idx + 1
 unit_row = df.loc[unit_idx]
 label_row = df.loc[label_idx]
 # 3. Spaltennamen bauen
 headers = []
 for u, l in zip(unit_row, label_row):
    if pd.isna(l):
        headers.append(str(u))
    elif pd.isna(u):
        headers.append(str(l))
    else:
        headers.append(f"{l} ({u})")
 # 4. Daten unterhalb der Headerzeilen
 data = df.loc[label_idx+1:].reset_index(drop=True)
 data.columns = headers
 # Neue Kopie mit eindeutigen Spaltennamen
 data2 = data.copy()
 data2.columns = [
    "col0",
    "titel",
    "col2",
    "zeitraum",
    "minus_kt",
    "plus_kt",
    "minus_pct",
    "plus_pct",
 ]
 # Titelzeilen entfernen
 mask_title = data2["titel"].isin([
    "Erlaubte Abweichungen der Bedarfserfüllung",
    "Kraftwerk",
    "Kraftwerke",
    "Veredlung ISP"
 ])
 # kraftwerk steht in col2, nach unten füllen
 data3["kraftwerk"] = data3["col2"].ffill()
 # Zeilen ohne Zeitraum entfernen
 data3 = data3.dropna(subset=["zeitraum"]).reset_index(drop=True)
 # numerische Spalten konvertieren
 for col in ["minus_kt", "plus_kt", "minus_pct", "plus_pct"]:
    data3[col] = pd.to_numeric(data3[col], errors="coerce")
 # Endauswahl
 result = data3[["kraftwerk", "zeitraum", "minus_kt", "plus_kt", "minus_pct", "plus_pct"]]
 data3 = data2.copy()
 data3["kraftwerk"] = data3["col2"].ffill()
 data3 = data3.dropna(subset=["zeitraum"]).reset_index(drop=True)
 for col in ["minus_kt", "plus_kt", "minus_pct", "plus_pct"]:
    data3[col] = pd.to_numeric(data3[col], errors="coerce")
 veredelung_bounds = data3[["kraftwerk", "zeitraum", "minus_kt", "plus_kt", "minus_pct", "plus_pct"]]
 # veredelung_bounds.rename({"kraftwerk":"kohleart"}, inplace=True)
 veredelung_bounds = veredelung_bounds.rename(columns={"kraftwerk":"kohlesorte"})
 veredelung_bounds[["minus"]] = veredelung_bounds[["minus_kt"]]*1000
 veredelung_bounds[["plus"]] = veredelung_bounds[["plus_kt"]]*1000
 veredelung_bounds.drop(columns=["minus_kt", "plus_kt"],inplace=True)
 veredelung_bounds.to_parquet(OUTPUT_DIR / "veredelung_bounds.parquet")
 print("Saved veredelung_bounds.parquet")
 veredelung_bounds
 # %% [markdown]
 # ## Kohlesorten-Mischverhältnis
 # %%
 raw = pd.read_excel(path, sheet_name="Parameter", header=None)
 # J3:P16 -> Zeilen 2:16, Spalten 9:16 (0-basiert, rechte Grenze exklusiv)
 block = raw.iloc[2:16, 9:16].copy()
 # Leere Zeilen entfernen
 df = block.dropna(how="all").reset_index(drop=True)
 # Header finden: Einheitenzeile enthält "[%]"
 unit_idx = df[df[12].astype(str).str.contains(r"\[%\]", regex=True)].index[0]
 label_idx = unit_idx + 1
 unit_row = df.loc[unit_idx]
 label_row = df.loc[label_idx]
 # Spaltenüberschriften konstruieren
 headers = []
 for u, l in zip(unit_row, label_row):
    if pd.isna(l):
        headers.append(str(u))
    elif pd.isna(u):
        headers.append(str(l))
    else:
        headers.append(f"{l} ({u})")
 # Daten unterhalb der Headerzeilen
 data = df.loc[label_idx+1:].reset_index(drop=True)
 data.columns = headers
 # Spalten sinnvoll benennen
 data2 = data.copy()
 data2.columns = [
    "titel",
    "kraftwerk",
    "kohlesorte",
    "ziel_low",
    "ziel_high",
    "maximal",
    "minimal",
 ]
 # Kraftwerk nach unten füllen
 data2["kraftwerk"] = data2["kraftwerk"].ffill()
 # *** WICHTIG: nach kohlesorte filtern, nicht nach titel ***
 data3 = data2[data2["kohlesorte"].notna()].reset_index(drop=True)
 # Finaler DataFrame
 kohle_mix = data3[[
    "kraftwerk",
    "kohlesorte",
    "ziel_low",
    "ziel_high",
    "maximal",
    "minimal",
 ]]
 # numerische Spalten in konsistente floats umwandeln
 num_cols = ["ziel_low", "ziel_high", "maximal", "minimal"]
 kohle_mix[num_cols] = kohle_mix[num_cols].apply(pd.to_numeric, errors="coerce")
 kohle_mix.to_parquet(OUTPUT_DIR / "kohle_mix.parquet")
 print("Saved kohle_mix.parquet")
 kohle_mix
 # %% [markdown]
 # ## Förderkapazitäten
 # %%
 # J19:M23 -> Zeilen 18:23, Spalten 9:13 (0-basiert)
 block = pd.read_excel(path, sheet_name="Parameter", header=None).iloc[18:23, 9:13].copy()
 # leere Zeilen entfernen
 df = block.dropna(how="all").reset_index(drop=True)
 # Titelzeile "Förderkapazität" rausfiltern
 df = df[df[9] != "Förderkapazität"].reset_index(drop=True)
 # Spalten benennen
 df.columns = ["kategorie", "tagebau", "zeitraum", "maximal"]
 # "Tagebau" nach unten auffüllen (für Nochten, Gesamt, Welzow-Süd)
 df["kategorie"] = df["kategorie"].ffill()
 # Maximalwert in Zahl konvertieren
 df["maximal"] = pd.to_numeric(df["maximal"], errors="coerce")
 # falls du nur die wesentlichen Infos brauchst:
 foerderkap = df[["tagebau", "zeitraum", "maximal"]]
 foerderkap["maximal"] = foerderkap["maximal"]*1000
 foerderkap.to_parquet(OUTPUT_DIR / "foerderkapaz.parquet")
 print("Saved foerderkap.parquet")
 foerderkap
 # %% [markdown]
 # ## Verladungskapazitäten
 # %%
 raw = pd.read_excel(path, sheet_name="Parameter", header=None)
 # J26:M30 -> rows 25:30, cols 9:13
 block = raw.iloc[25:30, 9:13].copy()
 # vollständig leere Zeilen entfernen
 df = block.dropna(how="all").reset_index(drop=True)
 # Titelzeile entfernen
 df = df[df[9] != "Verladungskapazität"].reset_index(drop=True)
 # Spalten sinnvoll benennen
 df.columns = ["kategorie", "verladung", "zeitraum", "maximal"]
 # Verladung nach unten auffüllen
 df["verladung"] = df["verladung"].ffill()
 # Maximalwert numerisch
 df["maximal"] = pd.to_numeric(df["maximal"], errors="coerce")
 # finale Auswahl
 verladung = df[["verladung", "zeitraum", "maximal"]]
 verladung["maximal"] = verladung.maximal*1000
 verladung.to_parquet(OUTPUT_DIR / "verladungskap.parquet")
 print("Saved verladungskap.parquet")
 verladung
 # %% [markdown]
 # ## Zugdurchlass
 # %%
 raw = pd.read_excel(path, sheet_name="Parameter", header=None)
 block = raw.iloc[3:21, 17:24].copy()
 block.replace("unlimitiert", np.inf, inplace=True)
 # komplett leere Zeilen entfernen
 df = block.dropna(how="all").reset_index(drop=True)
 # Kopfzeilen / Überschrift entfernen
 mask_header = df.apply(
    lambda r: r.astype(str).str.contains(
        "Zugdurchlasskapazität|Maximal|Vielfaches von", regex=True
    ).any(),
    axis=1,
 )
 df = df[~mask_header].reset_index(drop=True)
 # Spalten benennen
 df.columns = ["von", "start", "zum", "ziel", "zeitraum", "maximal", "vielfaches_von"]
 # numerische Spalten nach float konvertieren
 for col in ["maximal", "vielfaches_von"]:
    df[col] = pd.to_numeric(df[col], errors="coerce")
 # alle numerischen Werte * 1000
 df["maximal"] = df["maximal"] * 1000
 # fertiger DataFrame
 zugdurchlass = df.copy()
 zugdurchlass.to_parquet(OUTPUT_DIR / "zugdurchlass.parquet")
 zugdurchlass
 # %% [markdown]
 # # Mappe Rohkohlebedarf
 # %%
 raw = pd.read_excel(path, sheet_name="Rohkohlebedarf", header=None)
 df = raw.iloc[2:36, 1:15].copy().reset_index(drop=True)
 jahr = int(df.loc[0, 2])
 monat = str(df.loc[1, 2])
 kw_header = df.loc[1, 4:10].tolist()
 ver_header = df.loc[1, 12:14].tolist()
 kw_names = kw_header[:-1] + ["Gesamt_KW"]
 ver_names = ver_header[:-1] + ["Gesamt_Veredlung"]
 data = df.loc[3:].reset_index(drop=True)
 out = pd.DataFrame()
 out["jahr"] = jahr
 out["monat"] = monat
 out["datum"] = pd.to_datetime(data[1])
 for idx, name in zip(range(4, 4+len(kw_names)), kw_names):
    out[name] = pd.to_numeric(data[idx], errors="coerce")
 for idx, name in zip(range(12, 12+len(ver_names)), ver_names):
    out[name] = pd.to_numeric(data[idx], errors="coerce")
 # units: convert kt to t
 kw_cols = kw_names
 out[kw_cols] = out[kw_cols] * 1000
 # convert Gesamt_Veredlung from kt to t
 welz_col, nocht_col, ges_ver_col = ver_names
 out[ges_ver_col] = out[ges_ver_col] * 1000
 out = pd.DataFrame()
 out["datum"] = pd.to_datetime(data[1])
 out["jahr"] = jahr
 out["monat"] = monat
 for idx, name in zip(range(4, 4+len(kw_names)), kw_names):
    out[name] = pd.to_numeric(data[idx], errors="coerce")
 for idx, name in zip(range(12, 12+len(ver_names)), ver_names):
    out[name] = pd.to_numeric(data[idx], errors="coerce")
 kw_cols = kw_names
 out[kw_cols] = out[kw_cols] * 1000
 welz_col, nocht_col, ges_ver_col = ver_names
 out[ges_ver_col] = out[ges_ver_col] * 1000
 out.rename(columns={"Welzower Kohle":"Veredel_Welzower", "Nochtener Kohle": "Veredel_Nochtener"}, inplace=True)
 out.to_parquet(OUTPUT_DIR / "rohkohlebedarf.parquet")
 print("Saved rohkohlebedarf.parquet")
 out.round(5)
 # %% [markdown]
 # # Mappe Verfügbarkeit
 # %%
 import pandas as pd
 raw = pd.read_excel(path, sheet_name="Verfügbarkeit", header=None)
 # Jahr/Monat bleiben statisch in C3/C4
 jahr = int(raw.iloc[2, 2])
 monat = str(raw.iloc[3, 2])
 # B8:J38 (Datum in Spalte B, Wochentag in Spalte C)
 df = raw.iloc[7:38, 1:10].copy().reset_index(drop=True)
 # "Datum"-Zeile entfernen
 data = df.copy()
 data = data[data[1] != "Datum"].reset_index(drop=True)
 data = data[data[1].notna()].reset_index(drop=True)
 ver = pd.DataFrame()
 ver["datum"] = pd.to_datetime(data[1])
 ver["jahr"] = jahr
 ver["monat"] = monat
 # Welzow-Süd Schicht 1 2 3 in cols 4,5,6
 ver["Welzow_Sued_S1_t"] = pd.to_numeric(data[4], errors="coerce") * 1000
 ver["Welzow_Sued_S2_t"] = pd.to_numeric(data[5], errors="coerce") * 1000
 ver["Welzow_Sued_S3_t"] = pd.to_numeric(data[6], errors="coerce") * 1000
 # Boxberg (NO+RW) Schicht 1 2 3 in cols 7,8,9
 ver["Boxberg_NO_RW_S1_t"] = pd.to_numeric(data[7], errors="coerce") * 1000
 ver["Boxberg_NO_RW_S2_t"] = pd.to_numeric(data[8], errors="coerce") * 1000
 ver["Boxberg_NO_RW_S3_t"] = pd.to_numeric(data[9], errors="coerce") * 1000
 # ver.to_parquet
 ver.to_parquet(OUTPUT_DIR / "Verfuegbarkeiten.parquet")
 print("Saved Verfuegbarkeiten.parquet")
 ver.round(5)
 # KVB Nord Zugdurchlasskapazitäten (L8:N38)
 kvb_block = raw.iloc[7:38, 11:14].copy().reset_index(drop=True)
 kvb_block = kvb_block.iloc[: len(data)].reset_index(drop=True)
 kvb = pd.DataFrame()
 kvb["datum"] = pd.to_datetime(data[1])
 kvb["jahr"] = jahr
 kvb["monat"] = monat
 kvb["KVB_Nord_S1_t"] = pd.to_numeric(kvb_block[11], errors="coerce") * 1000
 kvb["KVB_Nord_S2_t"] = pd.to_numeric(kvb_block[12], errors="coerce") * 1000
 kvb["KVB_Nord_S3_t"] = pd.to_numeric(kvb_block[13], errors="coerce") * 1000
 kvb.to_parquet(OUTPUT_DIR / "zugdurchlass_kvb_nord.parquet")
 print("Saved zugdurchlass_kvb_nord.parquet")
 # %% [markdown] 
 # # Bunker 
 raw = pd.read_excel(path, sheet_name="Parameter", header=None)
 # Ausschnitt R23:W30 (0-basiert: Zeilen 22–29, Spalten 17–22)
 bunker = raw.iloc[22:30, 17:23].copy()
 # Kraftwerks- und Veredlungsbunker (Jänschwalde, SP, BW3, ISP)
 plants = bunker.iloc[25-22:29-22].reset_index(drop=True)
 plants.columns = [
    "typ",
    "anlage",
    "anfang_mo_di_kt",
    "anfang_rest_kt",
    "zielbestand_kt",
    "maximal_kt",
 ]
 # Typ auffüllen
 plants["typ"] = plants["typ"].ffill()
 # numerische Werte konvertieren
 for col in ["anfang_mo_di_kt", "anfang_rest_kt", "zielbestand_kt", "maximal_kt"]:
    plants[col] = pd.to_numeric(plants[col], errors="coerce")
 # *** Umrechnung in t ***
 plants = plants.rename(columns={
    "anfang_mo_di_kt": "anfang_mo_di_t",
    "anfang_rest_kt": "anfang_rest_t",
    "zielbestand_kt": "zielbestand_t",
    "maximal_kt": "maximal_t",
 })
 plants[["anfang_mo_di_t", "anfang_rest_t", "zielbestand_t", "maximal_t"]] *= 1000
 # Vorfahrfenster
 vorfahrfenster_tage = pd.to_numeric(bunker.loc[29, 19], errors="coerce")
 plants.to_parquet(OUTPUT_DIR / "bunker.parquet")
 print("Saved bunker.parquet")
 plants
 pd.DataFrame([{"vorfahrfenster_tage": vorfahrfenster_tage}]).to_parquet(
    OUTPUT_DIR / "bunker_vorfahrfenster.parquet"
 )
 print("Saved bunker_vorfahrfenster.parquet")
 # %%
 print("\n ####################### Done preprocessing exploration_preprocess.py ####################### \n")
		`@ -0,0 +1,3 @@`
							`from .model_builder import build_model, load_tables, solve_model`

							`__all__ = ["build_model", "load_tables", "solve_model"]`