Quy hoạch động trên cây

I. Giới thiệu

    Quy hoạch động trên cây (Dp On Tree\text{Dp On Tree}), là một dạng bài quy hoạch động đặc biệt, sử dụng để giải các bài toán quy hoạch động trên đồ thị có dạng cây. Ở dạng bài này, thường sẽ phải tìm công thức truy hồi cho các nút trên cây dựa vào các nút con của nó. Khi đặt hàm mục tiêu, thường sẽ xuất hiện 11 trạng thái là ii, có nghĩa là chúng ta đang đi giải bài toán trên cây con có nút gốc là nút ii. Dạng bài này giống với quy hoạch động thông thường, khi chúng ta cần xác định cấu trúc con tối ưu, tuy nhiên điểm khác biệt là ta sẽ định nghĩa hàm mục tiêu cho từng nút và tính toán dựa trên các nút con của nút đó.

    Trước khi đọc chuyên đề này, bạn đọc cần nắm được những kiến thức cơ bản của quy hoạch động, các thuật toán duyệt đồ thị DFS, BFS\text{DFS, BFS}; cũng như các khái niệm về cây.

II. Một số bài toán Quy hoạch động trên cây

Bài toán 1

    Đề bài: Cho một cây TT gồm NN (N105)(N \le 10^5) đỉnh, nút thứ ii của cây có gắn lượng tiền cic_i. Cần chọn ra một dãy các nút trên cây, sao cho không có bất kỳ hai nút kề nhau nào được chọn (hai nút kề nhau là hai nút có cạnh nối trực tiếp), và tổng lượng tiền thu được từ các nút được chọn là lớn nhất có thể.

    Nhận xét: Bài toán này khá giống với bài toán quy hoạch động cơ bản trên mảng một chiều: Cho trước dãy số AA gồm NN phần tử a1,a2,...,aNa_1, a_2,..., a_N, chọn ra một dãy con sao cho tổng của chúng là lớn nhất và không có hai phần tử liên tiếp nào cùng được chọn. Ta đặt dpidp_i là tổng lớn nhất thu được từ a1a_1 tới aia_i, và sẽ thu được công thức dpi=max(dpi2+ai,dpi1)dp_i = max(dp_{i - 2} + a_i, dp_{i - 1}) - nghĩa là lấy max giữa việc chọn aia_i và không chọn aia_i.

    Hướng tiếp cận:

  • Khác với bài toán trên mảng một chiều, bài toán của chúng ta cần phải giải trên một cấu trúc cây. Vậy đầu tiên ta cần đặt gốc cho cây, giả sử đó là nút 1 (dfs từ 1), sau đó đặt dpudp_u là kết quả cho bài toán con ở cây con gốc uu, thì kết quả cuối cùng sẽ là dp1dp_1.

    Công thức truy hồi:

  • Bây giờ, giống với bài toán trên mảng 11 chiều, ta sẽ thử chọn nút uu hoặc không chọn nút uu. Nếu ta chọn nút uu, thì không được chọn các nút con trực tiếp của uu; ngược lại nếu không chọn nút uu thì có thể chọn bất kỳ nút con nào của uu. Như vậy công thức có thể viết ở dạng khái quát như sau:

    dpu=max(dpv,cu+(mọi dpj)),v laˋ con của u vaˋ j laˋ caˊc nuˊt con của vdp_u = max(dp_v, c_u + \sum(\text{mọi }dp_j)), \text{v là con của u và j là các nút con của v}

  •     Để đơn giản hóa, ta đặt fuf_ugug_u lần lượt là tổng lớn nhất thu được trên cây con gốc uu, có chọn nút uu và không chọn nút uu. Kết quả cuối cùng sẽ là maxf1,g1)\text{max}f_1, g_1). Khi đó, công thức quy hoạch động sẽ trở nên rất đơn giản:

    • fu=cu+(gv),v laˋ con của uf_u=c_u + \sum(g_v), \text{v là con của u} (chọn uu nên không được chọn con của nó).
    • gu=(max(fv,gv)),v laˋ con của ug_u=\sum(\text{max}(f_v, g_v)), \text{v là con của u} (không chọn uu nên có thể chọn con của nó, nhưng bài toán ở nút con vv cũng có thể chọn hoặc không chọn vv).
  •     Lưu ý rằng, kết quả của bài toán ở một nút uu sẽ phụ thuộc vào tất cả các nút con của nó, do đó ta sẽ gọi đệ quy với tất cả các con của uu rồi cuối cùng mới cập nhật lên nút uu khi đã duyệt xong nhanh dfs gốc uu.

    Độ phức tạp: Giải thuật có độ phức tạp bằng với độ phức tạp của thao tác DFS là O(N+(N1))O(N)O\big(N + (N - 1)\big) \approx O(N).

    Cài đặt:

#include <bits/stdc++.h>
using namespace std;

const int maxn = 1e5 + 10;
int c[maxn], f[maxn], g[maxn];
vector < int > adj[maxn]; // Danh sách kề của các nút.

void dfs(int u, int par_u)
{
    // Hai biến tổng lưu sum(g[v]) và sum(max(f[v], g[v]))
    int sum_f = 0, sum_g = 0;

    for (int v: adj[u])
    {
        if (v == par_u)
            continue;

        dfs(v, u);

        sum_f += g[v];
        sum_g += max(f[v], g[v]);
    }

    f[u] = c[u] + sum_f;
    g[u] = sum_g;
}

int main()
{
    int N;
    cin >> N;

    for (int i = 1; i <= N; ++i)
        cin >> c[i];

    for (int i = 1; i < N; ++i)
    {
        int u, v;
        cin >> u >> v;

        adj[u].push_back(v);
        adj[v].push_back(u);
    }

    dfs(1, 0);

    cout << max(f[1], g[1]);
}

Bài toán 2

    Đề bài: Cho một cây TT gồm NN đỉnh (N105)(N \le 10^5). Một cây con của cây TT là một cách xóa đi một số đỉnh cùng các cạnh liên thuộc với nó, sao cho các đỉnh còn lại vẫn liên thông. Trọng số của một cây là tổng trọng số của tất cả các cạnh trên cây đó, nếu như cây chỉ có 11 đỉnh thì xem như trọng số là 00. Hãy xác định cây con có trọng số lớn nhất?

    Hướng tiếp cận: Đặt dpudp_u là trọng số của cây con lớn nhất với gốc là uu. Giả sử uu có các nút con là v1,v2,...,vkv_1, v_2,..., v_k. Từ cây con ban đầu chỉ bao gồm đỉnh uu, ta sẽ thử thêm các nhánh gốc v1,v2,..,vkv_1, v_2,.., v_k nối vào nếu như trọng số mới tạo thành là một số không âm. Ta sẽ đặt gốc của cây là đỉnh 11, kết quả sẽ là max(dpu),1uN\text{max}(dp_u), 1 \le u \le N.

    Công thức truy hồi:

    dpu+=dpu+(dpvi+cu,vi);i:1iNdp_u+=dp_u+(dp_{v_i} + c_{u, v_i}); \forall i:1 \le i \le N

    Cài đặt:

#include <bits/stdc++.h>
#define int long long
#define task "MaxTree."
#define inf 1e9 + 7
#define x first
#define y second

using namespace std;
const int maxn = 50001;
int N, dp[maxn];
vector < pair < int, int > > adj[maxn]; // Danh sách kề và trọng số cạnh của các đỉnh.

void enter()
{
    cin >> N;

    for (int i = 1; i < N; ++i)
    {
        int u, v, c;
        cin >> u >> v >> c;

        adj[u].push_back({v, c});
        adj[v].push_back({u, c});
    }
}

void dfs(int u, int par)
{
    dp[u] = 0; // Khởi tạo cây con đầu tiên chỉ gồm đỉnh u.

    for (auto vertex: adj[u])
    {
        int v = vertex.first, c = vertex.second;

        if (v == par)
            continue;

        dfs(v, u);

        if (dp[v] + c > 0)
            dp[u] += (dp[v] + c);
    }
}

void solution()
{
    dfs(1, 0);

    int res = *max_element(dp + 1, dp + 1 + N);
    cout << res;
}

main()
{
    ios_base::sync_with_stdio(false);
    cin.tie(0); cout.tie(0);

    enter();
    solution();

    return 0;
}

    Vừa rồi là những bài toán cơ bản để bạn đọc có những hình dung cụ thể về quy hoạch động trên cây. Bây giờ chúng ta sẽ đi vào nghiên cứu một số bài toán nâng cao hơn.

Bài toán 3

    Đề bài: Cho một cây TT gồm NN đỉnh, hãy tính độ dài đường đi dài nhất giữa hai nút bất kỳ trên cây (còn gọi là đường kính của cây). Độ dài đường đi giữa hai nút trên cây được tính bằng số cạnh đi qua trên đường đi đó.

    Hướng tiếp cận: Đầu tiên, đặt gốc của cây ở nút 11. Với mỗi nút xx của cây, sẽ tồn tại hai đường đi dài nhất như sau:

  • Đường đi dài nhất xuất phát từ xx, đi vào một nút thuộc cây con gốc xx. Đặt đường đi này là f(x)f(x) (đường màu xanh).
  • Đường đi dài nhất xuất phát từ 11 đỉnh uu thuộc cây con gốc xx, đi qua xx rồi kết thúc tại một đỉnh vv cũng thuộc cây con gốc xx (uv)(u \ne v). Gọi đường đi này là g(x)g(x) (đường màu đỏ).

    

  • Nếu như ta tính max(f(x),g(x))\text{max}(f(x), g(x)) của mọi nút xx trên cây, thì ta sẽ tìm được đường kính của cây. Bây giờ ta sẽ xem xét cách tính các giá trị f(x)f(x)g(x)g(x).

    Công thức truy hồi:

  • Giả sử một nút uu có các nút con lần lượt là v1,v2,...,vkv_1, v_2,...,v_k, vậy fu=1+max(fv1,fv2,...,fvk)f_u = 1 + \text{max}(f_{v_1}, f_{v_2},..., f_{v_k}) (Có thêm 11 cạnh nối giữa nút uu và nút con có fv max)f_v \text{ max}).
  • Đối với gug_u, vì đường đi này sẽ xuất phát từ 1 đỉnh v1v_1 và kết thúc tại một đỉnh v2v_2 cùng thuộc cây con gốc uu. Mà ta cần đường đi này dài nhất, nên công thức là gu=2+(2 giaˊ trị lớn nhaˆˊt trong tập {fv1,fv2,...,fvk})g_u = 2 + \text{(2 giá trị lớn nhất trong tập }\{f_{v_1}, f_{v_2},..., f_{v_k}\}) (Có thêm hai cạnh nối giữa uuv1,v2)v_1, v_2).

    Đánh giá độ phức tạp: Độ phức tạp tổng quát của giải thuật là O(Nlog(N)),O(Nlog(N)), vì trong khi DFS,\text{DFS}, ta cần sử dụng thêm một cấu trúc dữ liệu priority_queue hoặc set để tăng tốc thuật toán.

    Cài đặt: Khi tính toán trên cây con gốc uu, ta cần phải lưu trữ hết các giá trị f(v)f(v) với vv là con của uu để lấy hai giá trị lớn nhất trong tập đó. Để làm việc này ta có thể lưu các giá trị f(v)f(v) vào một set hoặc priority_queue trong quá trình DFS\text{DFS} xuống các nút con của uu.

int diameter, f[maxn], y[maxn];

void dfs(int u, int par)
{
    priority_queue < int > f_values;

    for (int v: adj[u])
    {
        if (v == par)
            continue;

        dfs(v, u);

        f_values.push(f[v]);
    }

    f[u] = 0;

    if (!f_values.empty())
        f[u] = 1 + f_values.top();
    if (f_values.size() >= 2)
    {
        g[u] = 2 + f_values.top();
        f_values.pop();
        g[u] += f_values.top();
    }

    diameter = max(diameter, max(f[u], g[u]));
}

Bài toán 4

    Đề bài: Cho một cây gồm NN đỉnh và N1N-1 cạnh. Đỉnh thứ ii của cây được gán một nhãn ci (1iN)c_i\text{ }(1≤i≤N) – gọi là trọng số của đỉnh ii. Định nghĩa một cây con của cây ban đầu là một cách chọn ra một số đỉnh của cây ban đầu sao cho chúng vẫn liên thông với nhau. Trọng số của cây con được tính bằng tổng trọng số của tất cả các đỉnh trên cây con đó. Hãy tìm cây con gồm đúng PP đỉnh có tổng trọng số lớn nhất?

    Hướng tiếp cận:

  • Vẫn giống như các bài trước, ta sẽ hướng đến đặt hàm mục tiêu trên cây con gốc uu. Ở bài này, các đỉnh được chọn cần phải liên thông, nên ta sẽ đặt fu,jf_{u, j} là trọng số lớn nhất thu được trên cây con gốc uu khi chọn jj đỉnh liên thông (bao gồm cả đỉnh uu). Không cần thiết phải xét trường hợp không chọn đỉnh uu, vì nếu không chọn đỉnh uu thì phải chọn đủ jj đỉnh trên một nhánh con nào đó của nó (không thể chọn trên nhiều nhánh con mà không chọn đỉnh uu vì khi đó tập đỉnh chọn ra sẽ không liên thông được), và bài toán lại trở thành chọn jj đỉnh trên một cây con gốc vv (bao gồm cả vv).
  • Đặt gốc của cây là đỉnh 11. Giả sử đỉnh uukk đỉnh con là v1,v2,...,vkv_1, v_2,..., v_k. Giờ để tính fu,jf_{u, j}, ta cần chọn ra (j1)(j - 1) đỉnh liên thông ở các nhánh con của uu (1 đỉnh chính là uu). Bài toán lại trở thành tìm (j1)(j - 1) đỉnh trên kk nhánh con sao cho tổng trọng số là lớn nhất. Ta sẽ đặt gi,jg_{i, j} là tổng trọng số lớn nhất thu được khi chọn jj đỉnh trên các nhánh con v1,v2,...,viv_1, v_2,..., v_i. Trước khi tính fu,j,f_{u, j}, quy hoạch động tính các gv,jg_{v, j} trước, cuối cùng fu,j=gk,j1+cuf_{u, j}=g_{k, j - 1} + c_u.

    Công thức truy hồi:

  • Tính gi,j:g_{i, j}: Xét tới cây con gốc viv_i, có thể chọn từ các cây con gốc v1,v2,...,vi1v_1, v_2,..., v{i - 1} đúng kk đỉnh, vậy cần chọn tiếp jkj - k đỉnh từ cây con gốc viv_i. Ta có công thức:

    gi,j={max(gi1,k,fvi,jk)0j<P;0kjg_{i, j} = \begin{cases} \text{max}(g_{i - 1, k}, f_{v_i, j - k})\\ 0 \le j < P; 0 \le k \le j \end{cases}

  • Tính fu,j:f_{u, j}: fu,j=gk,j1+cu;1jPf_{u, j}=g_{k, j - 1}+c_u; 1 \le j \le P.

    Cài đặt:

void dfs(int u, int par)
{
    for (int v: adj[u])
    {
        if (v == par)
            continue;

        dfs(v, u);
    }

    fill(g[0] + 1, g[0] + 1 + P, -inf);

    int i = 0;
    for (int v: adj[u])
    {
        if (v == par)
            continue;

        ++i; // Đếm số thứ tự các nút con của nút u.

        // Tính các g[i][j] cho mỗi f[u][j]. Lưu ý ở mỗi f[u][j] lại phải 
        // tính lại một lần tất cả các g[i][j].
        for (int j = 0; j < P; ++j)
        {
            g[i][j] = -inf;

            for (int k = 0; k <= j; ++k)
                g[i][j] = max(g[i][j], g[i - 1][k] + f[v][j - k]);
        }
    }

    f[u][0] = 0;
    f[u][1] = c[u];
    for (int j = 2; j <= P; ++j)
        f[u][j] = g[i][j - 1] + c[u];
}

void solution()
{
    for (int i = 1; i <= N; ++i)
        fill(f[i], f[i] + 1 + P, -inf);

    dfs(1, 0);

    int res = -inf;
    for (int u = 1; u <= N; ++u)
        res = max(res, f[u][P]);
    cout << res;
}

Bài toán 5

    Đề bài: Đất nước Delta là quốc đảo lớn nhất thế giới, tuy nhiên lại rất nghèo khó. Đất nước gồm tổng cộng N (N105)N \text{ }(N \le 10^5) hòn đảo nhỏ được đánh số từ 11 tới NN, nhà nước phải rất khó khăn mới xây dựng được N1N-1 tuyến phà đảm bảo giữa hai hòn đảo bất kỳ đều tới được nhau, tuyến phà thứ ii có độ dài là lil_i. Những tuyến phà di chuyển khá chậm chạp với vận tốc VP (m/s)VP \text{ }(m/s). Gần đây, đất nước Delta đột nhiên nhận được sự đầu tư của các nhà tư bản để phát triển du lịch, họ quyết định xây dựng KK cây cầu để thay thế cho KK tuyến phà bất kỳ. Nếu như di chuyển trên cầu, thì vận tốc di chuyển sẽ là VC (m/s)VC \text{ }(m/s). Cần chọn ra KK tuyến phà để xây cầu thay thế sao cho tổng thời gian để đi lại giữa mọi cặp đảo là nhỏ nhất (đường đi giữa hai đảo AABB coi như chỉ tính một lần từ AA tới BB, không xét đi từ BB về AA).

    Hướng tiếp cận: Để biết được cần thay thế những con đường nào, ta cần tính xem với con đường thứ ii, nếu thay phà bằng cầu thì tổng thời gian đi lại sẽ giảm đi bao nhiêu, từ đó chọn ra KK con đường có chênh lệch thời gian di chuyển nhiều nhất để xây cầu thay thế. Đặt huh_u là số lượng đỉnh thuộc cây con gốc uudpidp_i là thời gian di chuyển giảm đi nếu như thay tuyến phà thứ ii bằng một cây cầu.

    Công thức truy hồi:

  • Tính huh_u: Khi bắt đầu DFS\text{DFS}, đặt hu=1h_u=1 (mọi cây con đều có 11 đỉnh là chính nó). Giả sử đỉnh uu có các đỉnh con là v1,v2,...,vmv_1, v_2,..., v_m, thì hu=hu+i=1mvih_u = h_u+ \sum_{i=1}^m v_i.
  • Tính dpidp_i:
    • Giả sử cạnh thứ ii nối hai đỉnh (u,v)(u, v). Nếu bỏ cạnh này đi thì đồ thị chia làm hai cây con: Thứ nhất là cây con gốc vv, thứ hai là (Nh[v])(N-h[v]) đỉnh còn lại. Các đỉnh thuộc cây con gốc vv đều phải đi qua cạnh (u,v)(u, v) để tới được các đỉnh còn lại không thuộc cây con gốc vv. Vậy số lần cạnh thứ ii được sử dụng là: ti=hv×(Nhv)t_i=h_v \times (N-h_v).
    • Tổng chi phí giảm đi trên cạnh thứ ii sẽ là dpi=ti×(liVPliVC)=ti×li×(VCVP)VC×VPdp_i=t_i \times (\frac{l_i}{VP} - \frac{l_i}{VC})=\frac{t_i \times l_i \times (VC-VP)}{VC \times VP}.

    Cài đặt:

const int maxn = 1e5 + 10;

// Cấu trúc kề của 1 đỉnh, gồm đỉnh kề, độ dài cạnh và vị trí cạnh.
struct edge 
{
    int v, l, pos;
};

int N, K, VP, VC;
double dp[maxn], n_children[maxn];
vector < edge > adj[maxn];
priority_queue < pair < double, int > > route_minimize_cost;

void enter()
{
    cin >> N >> K >> VP >> VC;

    for (int i = 1; i < N; ++i)
    {
        int u, v, l;
        cin >> u >> v >> l;

        adj[u].push_back({v, l, i});
        adj[v].push_back({u, l, i});
    }
}

void dfs(int u, int par)
{
    n_children[u] = 1;

    for (edge adjacent: adj[u])
    {
        int v = adjacent.v, l = adjacent.l, p = adjacent.pos;

        if (v == par)
            continue;

        dfs(v, u);

        // Tính các giá trị h[u] và dp[i].
        n_children[u] += n_children[v];

        double cost_minimize = (double)l * (double)(VC - VP) / (double)(VC * VP);
        dp[p] = n_children[v] * (N - n_children[v]) * cost_minimize;

        // Lưu dp[i] vào 1 priority_queue để lấy ra K giá trị lớn nhất.
        route_minimize_cost.push({dp[p], p});
    }
}

void solution()
{
    dfs(1, 0);

    int replace_route = 0;
    while (replace_route < K)
    {
        ++replace_route;

        // Đưa ra số hiệu các tuyến phà bị thay thế.
        cout << route_minimize_cost.top().second << ' ';
        route_minimize_cost.pop();
    }
}

III. Nhận xét chung về phương pháp

    Đối với những bài toán quy hoạch động trên cây, bước 11 chúng ta luôn luôn đặt gốc cho cây, sau đó tiến hành DFS\text{DFS} từ gốc đó đi xuống.

    Khi đặt hàm mục tiêu, thông thường ta sẽ chú ý đến việc đặt hàm mục tiêu hướng đến tính kết quả trên cây con gốc uu của cây ban đầu, rồi dựa vào các nút con của uu để tính ra bài toán của cây con gốc uu. Cần lưu ý xem bài toán ở cây gốc u có thể tính liên tục hay cần phải tính hết các bài toán ở các nút con vv của nó rồi mới được tính chính nó.

    Sau khi đã gọi hàm mục tiêu hướng đến cây con gốc uu, ta mới xem xét thêm các trạng thái để kiểm soát các điều kiện khác của bài toán. Các trạng thái có thể là chọn đỉnh uu hoặc không chọn đỉnh uu, hay chọn bao nhiêu đỉnh trong cây con gốc uu,...

IV. Tài liệu tham khảo

Bình luận
Vui lòng đăng nhập để bình luận
Một số bài viết liên quan