59.排序好的大数据创建索引文件,并实现大文件的二分查找,根据索引百万数据秒读数据...

  • 创建索引
    1 //创建索引
    2 struct index
    3 {
    4     //保存每行偏移的位置
    5     int *pindex;
    6     //文件的总长度
    7     int length;
    8 }allindex;//索引

     

  • 初始化索引数组并把索引写入到文件
     1 //初始化索引数组,并把索引写入到文件
     2 void init(char *path)
     3 {
     4     printf("\n索引数组开始分配");
     5     allindex.length = N;
     6     //分配内存
     7     allindex.pindex = calloc(N, sizeof(int));
     8     printf("\n索引数组完成分配");
     9 
    10     printf("\n开始读取");
    11     //二进制读取文件 避免/r/n读取成/n
    12     FILE *pf = fopen("filesort.txt", "rb");
    13     if (pf == NULL)
    14     {
    15         return -1;
    16     }
    17     else
    18     {
    19         int alllength = 0;
    20         for (int i = 0; i < N; i++)
    21         {
    22             char str[50] = { 0 };
    23             fgets(str, 50, pf);
    24             //每一个首地址的偏移
    25             allindex.pindex[i] = alllength;
    26 
    27             int length = strlen(str);
    28             alllength += length;
    29         }
    30         fclose(pf);
    31     }
    32     printf("\n结束读取");
    33 
    34     printf("\n开始写入");
    35     //二进制方式打开文件,并写入索引
    36     FILE *pfw = fopen("index.txt", "wb");
    37     //写入
    38     fwrite(allindex.pindex, sizeof(int), allindex.length, pfw);
    39     //关闭文件
    40     fclose(pfw);
    41     printf("\n结束写入");
    42 
    43     //释放内存
    44     free(allindex.pindex);
    45 }

     

  • 从文件中读取索引到索引数组中
     1 //从文件中读取索引
     2 void qucik()
     3 {
     4     printf("\n索引数组开始分配");
     5     allindex.length = N;
     6     allindex.pindex = calloc(N, sizeof(int));//分配内存
     7     printf("\n索引数组完成分配");
     8 
     9 
    10     printf("\n开始读取");
    11     //以二进制读的方式读取索引
    12     FILE *pfw = fopen("index.txt", "rb");
    13     //读取
    14     fread(allindex.pindex, sizeof(int), allindex.length, pfw);
    15     //关闭文件
    16     fclose(pfw);
    17     printf("\n结束读取");
    18 }

     

  • 测试函数
     1   FILE *pf1 = fopen("index.txt", "rb");
     2     FILE *pf2 = fopen("filesort.txt", "rb");
     3     while (1)
     4     {
     5         printf("\n请输入要读取的行数");
     6         int num = 0;
     7         scanf("%d", &num);
     8 
     9         int indexnum = 0;
    10         fseek(pf1, num*sizeof(int), SEEK_SET);
    11         fread(&indexnum, sizeof(int), 1, pf1);//读索引到indexnum
    12 
    13         fseek(pf2, indexnum, SEEK_SET);
    14         char str[128] = { 0 };
    15         fgets(str, 128, pf2);//读取
    16         printf("\n%s", str);
    17 
    18     }
    19     fclose(pf1);
    20     fclose(pf2);

     

     

  • 根据索引文件对已经排序好的文件进行二分查找
     1 void binsearch(char *searchstr)
     2 {
     3     //头部
     4     int tou = 0;
     5     //尾部
     6     int wei = N - 1;
     7     //是否找到的标识
     8     int flag = 0;
     9     //如果头小于尾
    10     while (tou <= wei)
    11     {
    12         //获取中部
    13         int zhong = (tou + wei) / 2;
    14         //读取中部索引的内容
    15         char zhongstr[256] = { 0 };
    16         {
    17             //打开索引文件
    18             FILE *pf1 = fopen("index.txt", "rb");
    19             //打开排序好的文件
    20             FILE *pf2 = fopen("filesort.txt", "rb");
    21 
    22             //读zhong对应的地址存到indexnum中
    23             int indexnum = 0;
    24             fseek(pf1, zhong * sizeof(int), SEEK_SET);
    25             fread(&indexnum, sizeof(int), 1, pf1);
    26 
    27             //根据读取的位置读取文件到zhongstr中
    28             fseek(pf2, indexnum, SEEK_SET);
    29             fgets(zhongstr, 128, pf2);
    30 
    31             fclose(pf1);
    32             fclose(pf2);
    33         }
    34         //消除'\r或者\n'
    35         eatN(zhongstr);
    36         char pnewzhongstr[256] = { 0 };
    37         sprintf(pnewzhongstr, zhongstr);
    38         //进行处理,遇到-终止
    39         eatg(pnewzhongstr);
    40         //比较是否找到
    41         int res = strcmp(pnewzhongstr, searchstr);//1 0  -1
    42         if (res == 0)
    43         {
    44             flag = 1;
    45             printf("%s", zhongstr);
    46             break;
    47         }
    48         //如果中比searchstr要大
    49         else if (res == 1)
    50         {
    51             wei = zhong - 1;
    52         }
    53         //如果中比searchstr小
    54         else
    55         {
    56             tou = zhong + 1;
    57         }
    58 
    59 
    60     }
    61     //判断是否找到
    62     if (flag)
    63     {
    64         printf("\nfind");
    65     } 
    66     else
    67     {
    68         printf("\n not find");
    69     }
    70 }

     

  • 遇到'-'结束
     1 //遇到'-'结束
     2 void eatg(char *str)
     3 {
     4     while (*str!='\0')
     5     {
     6 
     7         if (*str=='-')
     8         {
     9             *str = '\0';
    10         }
    11         str++;
    12     }
    13 
    14 }

     

  • 测试函数
     1 void main()
     2 {
     3 
     4 
     5     char str[256] = { 0 };
     6     scanf("%s", str);
     7     binsearch(str);
     8 
     9 
    10 
    11     system("pause");
    12 }

     

转载于:https://www.cnblogs.com/xiaochi/p/8437140.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398679.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

booth算法实现乘法器

booth算法充分的利用到了补码的重要性&#xff0c;使得我们在利用补码进行计算时减少了很多时序。下面的表格是我们假设2 作为乘数所进行的分析。接下来&#xff0c;我将用代码向大家阐述。 1、开始的时候在乘数2的‘负一位’加上一个默认0值00100 2、先判断[0:-1],结果是2‘b0…

OS实验一实验报告

实验一、命令解释程序的编写实验 专业&#xff1a;商业软件工程 姓名&#xff1a;王泽锴 学号&#xff1a;201406114113 一、实验目的 &#xff08;1&#xff09;掌握命令解释程序的原理&#xff1b; &#xff08;2&#xff09;*掌握简单的DOS调用方法&#xff1b; &#xf…

机器学习的练功方式(四)——KNN算法

文章目录致谢致歉4 KNN算法4.1 sklearn转换器和估计器4.1.1 转换器4.1.2 估计器4.2 KNN算法4.2.1 概述4.2.2 电影类型分析4.2.3 算法实现致谢 闵氏距离_百度百科 (baidu.com) 机器学习之KNN&#xff08;k近邻&#xff09;算法详解_平原的博客-CSDN博客_knn 鸢尾花(Iris)数据集_…

bootstrap table入门例子

链接&#xff1a;https://pan.baidu.com/s/1jJ2Y89g 密码&#xff1a;eo7t <!DOCTYPE html> <html> <head><meta charset"utf-8"><link rel"stylesheet" type"text/css" href"lib/bootstrap.min.css">&…

Spring中实现监听的方法

在未使用框架进行编程的时候&#xff0c;我们常常在web.xml中加上这样一段话  <listener><listener-class>XXX</listener-class></listener> 在对应的类中实现ServletContextListener接口&#xff0c;这样在服务器已启动的时候&#xff0c;就会加载相…

《数学之美》读书笔记

之前拜读过吴军老师的《数学之美》。虽然这是一本科普性质的读物&#xff0c;但还是能从中获益匪浅。下面根据记忆以及之前做过的简要的书面笔记&#xff0c;做一个概括。 1.信息的作用在于消除不确定性&#xff0c;自然语言处理的大量问题都是找相关的信息。 2.关于搜索&#…

数据库杂谈(七)——数据库的存储结构

文章目录7 数据库的存储结构7.1 数据库访问管理-文件组织7.2 数据库访问管理——索引技术7 数据库的存储结构 让我们重新温习第六讲的所学知识。 这个图实际上我们要关注的是蓝色箭头指向的那一层。在这一层之上&#xff0c;我们都是对SQL语句动手&#xff0c;而在这一层之下&…

JSP中直接在输入框中校验

jsp: <label class"control-label col-sm-2" for"codeAdd">险种代码<span style"color: red;">*</span></label> <div classcontrols col-sm-4> <input class"form-control remote-validate" data-r…

【iCore3 双核心板_FPGA】例程十二:Modelsim仿真实验

实验指导书及代码包下载&#xff1a; 链接&#xff1a;http://pan.baidu.com/s/1hs4zNFY 密码&#xff1a;5z62 iCore3 购买链接&#xff1a; https://item.taobao.com/item.htm?id524229438677

机器学习的练功方式(五)——模型选择及调优

文章目录5 模型选择及调优5.1 数据增强5.2 过拟合5.3 交叉验证5.4 超参数搜索——网格搜索5 模型选择及调优 5.1 数据增强 有时候&#xff0c;你和你的老板说你数据不够&#xff0c;它是不会理你的。老板会发问&#xff1a;为什么你是做机器学习的要那么多数据干嘛&#xff0…

关于内存的一些基础知识

1、free&#xff1a;Display amount of free and used memory in the system. free显示的数值来自/proc/meminfo&#xff08;默认单位是KB&#xff09;。各个项的含义分别是&#xff1a; 1&#xff09;Mem这一行&#xff0c;shared&#xff1a;已废弃&#xff1b;buffers&#…

Flask 单例模式 session

一、单例模式 单例模式分为四种&#xff1a;基于文件的单例模式&#xff0c;基于类方法的单例模式&#xff0c;基于__new__的单例模式&#xff0c;基于metaclass的单例模式 1. 基于类方法的单例模式 - 不支持多线程模式 import threadingclass Singleton(object):def __init__(…

document.all

一.document.all是页面内所有元素的一个集合。例如&#xff1a; document.all(0)表示页面内第一个元素二.document.all可以判断浏览器是否是IE if(document.all){ alert("is IE!"); }三.也可以通过给某个元素设置id属性&#xff08;idaaaa&#xff09;,然后…

数据处理工具(一)——Matplotlib

文章目录致谢1 Matplotlib1.1 什么是Matplotlib1.2 实现一个简单的图1.3 Matplotlib三层结构1.3.1 容器层1.3.2 辅助显示层1.3.3 图像层1.3 使用模块1.3.1 画布的设置1.3.2 添加网格辅助背景1.3.3 附加属性1.3.4 标签1.3.5 刻度1.3.6 一个图上多条线1.3.7 子区域1.4 基础图表1.…

Java解析Rss(三)

2019独角兽企业重金招聘Python工程师标准>>> package com.ninemax.application.rss;import java.net.URL; import java.text.SimpleDateFormat; import java.util.List;import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S…

Redis服务器启动之后3个警告信息的解决方案

今天是年前最后一篇文章了&#xff0c;不想写太多的东西&#xff0c;就写一些有关Redis相关问题的解决方案。当我们启动了Redis服务器之后&#xff0c;会看到3个警告&#xff0c;如果没看到&#xff0c;那是很好的&#xff0c;但是我看到了。看到了就不能不管&#xff0c;所以就…

ASP .NET MVC 之Entity Framework入门教程及源码

本文主要的目的是 1. 说明Entity Framework Power Tools如何使用。 2. Entity Framework 快速门 实验环境&#xff1a; OS: Windows Server 2012, Windows 7 DE: VS2013 MVC 6.0Entity Framework SQL Server 2012 准备工作 基于现有数据库生成POCO数据类和数据库上下文需要借…

机器学习的练功方式(六)——朴素贝叶斯

文章目录致谢6 朴素贝叶斯6.1 概述6.2 概率论6.2.1 大数定律6.2.2 基本概念6.2.3 极大似然估计6.2.4 多项式分布6.2.4.1 伯努利分布6.2.4.2 二项分布6.2.5 朴素贝叶斯6.3 朴素贝叶斯文本分类6.3.1 一个例子6.3.2 拉普拉斯平滑系数6.3.3 算法实现6.4 贝叶斯分类器6.4.1 多项式贝…

ABAP中创建动态内表的三种方法(转载)

BAP中创建动态内表的三种方法 第一种&#xff1a; 如果我们需要的动态内表字段或者动态工作区和数据字典中的类型一致&#xff0c;可以直接使用CREATE DATA生成,当然也可以是自定义类型。 比如要产生和数据表MARA结构一致的动态内表&#xff1a; DATA : DY_TABLE TYPE REF TO D…

个人简介

我叫范华万&#xff0c;今天22岁&#xff0c;来自于福建省。目前在闽江学院就学。我学的是软件工程软件服务开发专业&#xff0c;能从事网站设计、java工程师、ps技术、c、数据库管理。本人性格乐观、开朗&#xff0c;有上进心、进取心&#xff0c;对学习认真负责&#xff0c;I…