深度优先搜素(DFS)
深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件) 。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次。
深度优先搜索类似于树的前序遍历
我们依据邻接表进行遍历,还需要运用递归的思想,这类似于堆栈的遍历方式。
同样以如下连通图为例:
构建其对应的邻接表:
采用深度优先搜素的遍历顺序如下:
注:蓝线划去的代表该顶点的visit[i]=1,无需多次遍历。
深度优先搜索步骤:
- 从某一顶点出发进行访问,该点首先被读入,visit[i]置为1
- 依次访问该点的一个邻接点
- 若该邻接点还有临界,那么访问该邻接点的一个邻接点;若没有,则返回上一步进行搜索
* 深度优先搜索函数代码:*
void DFS(AdjMatrix *G, int v)
{EdgeNode *p;printf("->%c",G->adjlist[v].vertex);visited[v]=1;p=G->adjlist[v].edgenext;while (p){ if(!visited[p->adjvex]) DFS(G,p->adjvex);p=p->next;}
} //从第v个顶点出发DFSvoid DFSTraverse(AdjMatrix *G)
{printf("广度优先搜索顺序");for(int v=0;v<G->n;++v)visited[v]=0;for(int v=0;v<G->n;++v)if(!visited[v]) DFS(G,v);//递归调用printf("\n\n");
}
具体代码如下:
#include <stdio.h>
#include <stdlib.h>
#define MaxVertices 100
#define MAX_VERTEX_NUM 10
typedef struct node{ //边表 int adjvex;node* next;
}EdgeNode; typedef struct{ //顶点表 int vertex; EdgeNode* edgenext;
}VertexNode; typedef VertexNode AdjList[MaxVertices]; typedef struct{ AdjList adjlist; int n,e;
}AdjMatrix;
int visited[MAX_VERTEX_NUM];
void CreateGraph(AdjMatrix* G)
{ int i,j,k,w,v; EdgeNode *s; printf("输入顶点数和边数(中间以空格分开):"); scanf("%d%d",&G->n,&G->e); printf("建立顶点表\n"); for (i=0;i<G->n;i++) { //fflush(stdin); //如果 stream 指向输入流(如 stdin),那么 fflush 函数的行为是不确定的。//故而使用 fflush(stdin) 是不正确的。getchar(); printf("请输入第%d个顶点的信息:",i+1);G->adjlist[i].vertex=getchar();G->adjlist[i].edgenext=NULL; } //前插法 printf("建立边表\n"); for (k=0;k<G->e;k++) { printf("输入有连接的顶点序号:"); scanf("%d%d",&i,&j); //对于直接相连的进行编入(即对输入“0 1”时,在0对应的边表中编入1) i-=1;j-=1; s=(EdgeNode*)malloc(sizeof(EdgeNode)); s->adjvex=j;//边表赋值 s->next=G->adjlist[i].edgenext; G->adjlist[i].edgenext=s; //对于间接相连的进行编入(即对输入“0 1”时,在1对应的边表中编入0)s=(EdgeNode*)malloc(sizeof(EdgeNode)); s->adjvex=i; s->next=G->adjlist[j].edgenext; G->adjlist[j].edgenext=s; }
}
void DispGraph(AdjMatrix *G)
{int i;for (i=0;i<G->n;i++) { printf("%d->",i+1); while(1) { if(G->adjlist[i].edgenext==NULL){printf("^");break; }printf("%d->",G->adjlist[i].edgenext->adjvex+1); G->adjlist[i].edgenext=G->adjlist[i].edgenext->next; } printf("\n"); }
}
void DFS(AdjMatrix *G, int v)
{EdgeNode *p;printf("->%c",G->adjlist[v].vertex);visited[v]=1;p=G->adjlist[v].edgenext;while (p){ if(!visited[p->adjvex]) DFS(G,p->adjvex);p=p->next;}
} //从第v个顶点出发DFS
void DFSTraverse(AdjMatrix *G)
{printf("广度优先搜索顺序");for(int v=0;v<G->n;++v)visited[v]=0;for(int v=0;v<G->n;++v)if(!visited[v]) DFS(G,v);//递归调用printf("\n\n");
}//DFSTraverse
int main()
{ freopen("1.txt","r",stdin);AdjMatrix* G= (AdjMatrix*)malloc(sizeof(AdjMatrix)); CreateGraph(G); DFSTraverse(G); DispGraph(G);
}
测试数据如下:
注:由于测试输入数据较多,程序可以采用文件输入
5 7
1
2
3
4
5
1 2
1 3
1 4
2 3
2 4
3 5
4 5