https://ac.nowcoder.com/acm/contest/11166/I
思路:dp[i][j] 是表示上上步走在i点,上一步走在j点的期望。首先我们很容易想到n^3的做法,那我们必须考虑去优化一维的时间复杂度。我们可以考虑使用前缀和优化dp转移。
我们枚举i点,那么j点必须是比i点要大的然后在他们的pos(位置)存入相应的值,再计算后缀和,那这些就是i点所有合法的情况了。
我们简单想一下,我们转移时可以由dp[i][x1]->dp[x2][i],即转移去它的前一步,可以知道x1是比i大,然后x2是比i小的。根据我上面说的将dp[i][x1]的情况预处理一下,然后转移的时候,我们枚举x2,然后取x2的pos的后缀和就是dp[x2][i]的答案。
最后统计答案的时候,只需要将dp[0][i]全部相加,然后除于n就是答案了。
#include <iostream>
#include <cstdio>
#include <fstream>
#include <algorithm>
#include <cmath>
#include <deque>
#include <vector>
#include <queue>
#include <string>
#include <cstring>
#include <map>
#include <stack>
#include <set>
#include <cstdlib>
#define INF 0x3f3f3f3f3f3f3f3f
#define inf 0x3f3f3f3f
#define FILL(a,b) (memset(a,b,sizeof(a)))
#define lson rt<<1
#define rson rt<<1|1
#define lowbit(a) ((a)&-(a))
#define ios std::ios::sync_with_stdio(false);std::cin.tie(0);std::cout.tie(0);
#define fi first
#define sc second
#define pb push_back
#define endl '\n'
#define all(x) (x).begin(),(x).end()
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<char,ll> pii;
int dx[8]= {-1,1,0,0,1,1,-1,-1},dy[8]= {0,0,1,-1,-1,1,-1,1};
const ll mod=998244353;
const ll N =5e3+10;
const ll M =250000;
const double eps = 1e-4;
//const double pi=acos(-1);
ll qk(ll a,ll b){ll ans=1;while(b){if(b&1) ans=ans*a%mod;a=a*a%mod;b/=2;}return ans;}
ll n,a[N];
ll sum[N],cnt[N],pos[N];
ll inv[N],dp[N][N];void sovle(){cin>>n;for(int i=1;i<=n;i++){ cin>>a[i];pos[a[i]]=i;}for(int i=1;i<=n;i++) inv[i]=qk(i,mod-2);for(int i=n;i>=1;i--){FILL(cnt,0);FILL(sum,0);for(int j=i+1;j<=n;j++){cnt[pos[j]]++;sum[pos[j]]=dp[i][j];}for(int j=n-1;j>=0;j--){cnt[j]+=cnt[j+1];sum[j]=(sum[j]+sum[j+1])%mod;}for(int j=0;j<i;j++){int id=pos[j];dp[j][i]=(sum[id]*inv[cnt[id]]%mod+1)%mod;}}ll ans=0;for(int i=1;i<=n;i++) ans=(ans+dp[0][i])%mod;ans=ans*inv[n]%mod;cout<<ans%mod<<endl;
}
int main()
{int t=1;while(t--){sovle();}return 0;
}