size_t strtok

C语言字符串长度统计函数strlen()的实现原理

C标准库中有一个字符串长度统计函数strlen(),用来统计字符串的长度,它的实现与下面类似。
复制纯文本复制
  1. #include <stdlib.h>
  2. size_t strlen( char *string )
  3. {
  4. int length = 0;
  5. // 依次访问字符串的内容,计算字符数,直至遇到NUL终止符
  6. while( *string++ != '\0' )
  7. length += 1;
  8.  
  9. return length;
  10. }
#include <stdlib.h>
size_t strlen( char *string )
{int length = 0;// 依次访问字符串的内容,计算字符数,直至遇到NUL终止符while( *string++ != '\0' )length += 1;return length;
}
两点注意:
  • size_t 为stddef.h中定义的数据类型,等价于 unsigned int,它的取值必须大于等于0。
  • while()循环条件中,*string++等价于*(string++)。string是指针变量,保存的是字符串的起始地址(第一个字符的地址),地址是一个整数,可以进行算术运算,加 1 后为下一个字符的地址。


在指针到达字符串末尾的NUL字节之前,while语句中*string++表达式的值一直为真。它同时增加指针的值,用于下一次测试。这个表达式甚至可以正确地处理空字符串。

如果这个函数调用时传递给它的是一个NULL指针,那么while语句中的间接访问将会失败。函数是不是应该在解引用指针前检查这个条件?从绝对安全的角度讲,应该如此。但是,这个函数并不负责创建字符串。如果它发现参数为NULL,它肯定发现了一个出现在程序其他地方的错误。 当指针创建时检查它是否有效是合乎逻辑的,因为这样只需检查一次。这个函数采用的就是这种方 法。如果函数失败是因为粗心大意的调用者懒得检查参数的有效性而引起的,那是他活该如此。

 

 

 

 

C语言统计输入的单词的个数

编写一个程序,对标准输入进行扫描,并对单词“the”出现的次数进行计数。进行比较时应该区分大小写,所以“The”和“THE”并不计算在内。你可以认为各单词由一个或多个空格字符分隔,而且输入行在长度上不会超过100个字符。 计数结果应该写到标准输出上。

声明—个长度为101个字节的缓冲区数组,用于保存100个字节的输入和NUL终止符。strtok 函数用于逐个提取单词。
复制纯文本复制
  1. // 计算标准输入中单词“the”出现的次数。字母是区分大小写的,输入中的单词由一个或多次空白字符分隔。
  2. #include <stdio.h>
  3. #include <string.h>
  4. #include <stdlib.h>
  5.  
  6. char const whitespace[] = " \n\r\f\t\v";
  7. int main ()
  8. {
  9. char buffer[101];
  10. int count;
  11. char *word;
  12. count = 0;
  13. // 读入文本行,直到发现EOF
  14. while( gets(buffer) ) {
  15. // 从缓冲区逐个提取单词,直到缓冲区内不再有单词。
  16. for( word = strtok ( buffer, whitespace );
  17. word != NULL;
  18. word = strtok( NULL, whitespace )
  19. ){
  20. if( strcmp( word, "the" ) == 0 )
  21. count += 1;
  22. }
  23. }
  24. printf("%d\n", count);
  25. return EXIT_SUCCESS;
  26. }


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/509051.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【保存】maven的pom.xml标签的xsi:schemaLocation处报错

maven装X的原因是 maven对下载不下来的jar文件会生成一个 *.lastUpdated 文件 &#xff0c;不将*.lastUpdated文件干掉&#xff0c;它是不会给你重新下载jar, so 将 *.lastUpdated 这个家伙干掉&#xff0c;再update一下就OK了 原文&#xff1a;https://blog.csdn.net/…

strlen() Bug

C语言strlen()以NUL作为字符串结束标记&#xff0c;自定义一个字符串长度统计函数消除这个Bug 分享到&#xff1a;QQ空间新浪微博腾讯微博豆瓣人人网我们知道&#xff0c;字符串长度统计函数 strlen() 以NUL作为字符串结束标记&#xff0c;但是很不幸的是&#xff0c;有时候字符…

C语言中文件的读取和写入

C语言中文件的读取和写入 注意&#xff1a; 1、由于C是缓冲写 所以要在关闭或刷新后才能看到文件内容 2、电脑处理文本型和二进制型的不同 &#xff08;因为电脑只认识二进制格式&#xff09; 在C语言中写文件 //获取文件指针 FILE *pFile fopen("1.txt", //打开文件…

基于ansj_seg和nlp-lang的简单nlp工具类

1、首先在pom中引入ansj_seg和nlp-lang的依赖包&#xff0c; ansj_seg包的作用&#xff1a; 这是一个基于n-GramCRFHMM的中文分词的java实现&#xff1b; 分词速度达到每秒钟大约200万字左右&#xff08;mac air下测试&#xff09;&#xff0c;准确率能达到96%以上; 目前实现了…

ArrayList的四种初始化方法

转载&#xff1a;https://beginnersbook.com/2013/12/how-to-initialize-an-arraylist/ Method 1: Initialization using Arrays.asList Syntax: ArrayList<Type> obj new ArrayList<Type>(Arrays.asList(Object o1, Object o2, Object o3, ....so on)); Exam…

C++ Deque(双向队列

C Deque(双向队列)C Deque(双向队列) 是一种优化了的、对序列两端元素进行添加和删除操作的基本序列容器。它允许较为快速地随机访问&#xff0c;但它不像vector 把所有的对象保存在一块连续的内存块&#xff0c;而是采用多个连续的存储块&#xff0c;并且在一个映射结构中保存…

java.lang.IllegalArgumentException: URLDecoder异常解决

异常&#xff1a; Exception in thread "main" java.lang.IllegalArgumentException: URLDecoder: Illegal hex characters in escape (%) pattern - For input string: "u9" at java.net.URLDecoder.decode(URLDecoder.java:194) at com.hbzx.co…

STL迭代器

STL迭代器及总结解释迭代器是一种对象&#xff0c;它能够用来遍历STL容器中的部分或全部元素&#xff0c;每个迭代器对象代表容器中的确定的地址。迭代器修改了常规指针的接口&#xff0c;所谓迭代器是一种概念上的抽象&#xff1a;那些行为上象迭代器的东西都可以叫做迭代器。…

C++ Sets MultiSets

C Sets & MultiSetsSTL Set介绍 集合(Set)是一种包含已排序对象的关联容器。多元集合(MultiSets)和集合(Sets)相像&#xff0c;只不过支持重复对象,其用法与set基本相同。Set 又称集合&#xff0c;实际上就是一组元素的集合&#xff0c;但其中所包含的元素的值是唯一的&am…

SSDB 配置文件详解

SSDB 的配置非常简单, 附带的 ssdb.conf 你不用修改便可以使用. 如果你要高度定制, 还是需要修改一些配置的. 下面做介绍. SSDB 的配置文件是一种层级 key-value 的静态配置文件, 通过一个 TAB 缩进来表示层级关系. 以 # 号开始的行是注释. 标准的配置文件如下: # ssdb-serve…

C++ Maps MultiMaps

C Maps & MultiMapsC Maps & MultiMaps C Maps是一种关联式容器&#xff0c;包含“关键字/值”对。C Multimaps和maps很相似&#xff0c;但是MultiMaps允许重复的元素。1.begin() 返回指向map头部的迭代器2.clear() 删除所有元素3.count() 返回指定元素出现的次数语法…

英语单词词干化表

博客&#xff1a;https://blog.csdn.net/potato012345/article/details/78091939 下载地址&#xff1a;https://github.com/Zhangtd/MorTransformation

c++ List(双向链表)

c List(双向链表)List(双向链表)介绍: List是一个线性链表结构&#xff0c;它的数据由若干个节点构成&#xff0c;每一个节点都包括一个信息块&#xff08;即实际存储的数据&#xff09;、一个前驱指针和一个后驱指针。它无需分配指定的内存大小且可以任意伸缩&#x…

Arrays.deepToString的使用

今天看别人的代码引用了这个函数&#xff0c;发现原来遍历数组(非List&#xff0c;例如&#xff1a;int [][] 类型等)可以直接调用Arrays.deepToString(数组名)可以直接输出结果&#xff0c;以前还傻不啦叽的的转换成List数组或者是for循环遍历。 Integer[][] allMovieComment…

C++ Vector(向量容器)

Vector介绍C Vector&#xff08;向量容器&#xff09; 是一个线性顺序结构。相当于数组&#xff0c;但其大小可以不预先指定&#xff0c;并且自动扩展。它可以像数组一样被操作&#xff0c;由于它的特性我们完全可以将vector 看作动态数组。 在创建一个vector 后&#xff0c;它…

出现特殊分隔符无法分隔解决方案

今天处理文本数据时候遇到这种文本用空格和tab正则匹配没有作用&#xff0c;后来问了同事发现可以用“\\uf8f5”去匹配。 待处理文本&#xff1a; A abbr.安  A-10IInone.美空军主力近距离空中支援攻击机&#xff0c;无愧为“坦克杀手”。 A-12none.夭折的美海…

java英文单词单复数转换

package steam;import java.util.*; import java.util.regex.*; /*** * 单复数转换类* 2018年12月30日*/public class Inflector {private static final Pattern UNDERSCORE_PATTERN_1 Pattern.compile("([A-Z])([A-Z][a-z])");private static final Pattern UNDERS…

最全英语单词下载地址

这两天搜集英文单词做词干化处理&#xff0c;虽说standford-NLP可以处理&#xff0c;但是效率不高&#xff0c;自己动手找单词做映射表&#xff0c;找单词真的痛苦&#xff01;&#xff01;&#xff01;放出以下地址最为保存和分享 github&#xff1a; https://github.com/dw…

NLP英文缩写词性含义

1. CC Coordinating conjunction 连接词 2. CD Cardinal number 基数词 3. DT Determiner 限定词&#xff08;如this,that,these,those,such&#xff0c;不定限定词&#xff1a;no,some,any,each,every,enough,either,neither,all,both,half,sever…