第四章 串 一、选择题 1.下面关于串的的叙述中,哪一个是不正确的?( )【北方交通大学 2001 一、5(2分)】 a.串是字符的有限序列 b.空串是由空格构成的串 c.模式匹配是串的一种重要运算 d.串既可以采用顺序存储,也可以采用链式存储 2 若串s1=‘abcdefg’, s2=‘9898’ ,s3=‘###’,s4=‘012345’,执行 concat(replace(s1,substr(s1,length(s2),length(s3)),s3),substr(s4,index(s2,‘8’),length(s2))) 其结果为( )【北方交通大学 1999 一、5 (25/7分)】 a.abc###g0123 b.abcd###2345 c.abc###g2345 d.abc###2345 e.abc###g1234 f.abcd###1234 g.abc###01234 3.设有两个串p和q,其中q是p的子串,求q在p中首次出现的位置的算法称为( ) a.求子串 b.联接 c.匹配 d.求串长 【北京邮电大学 2000 二、4(20/8分)】【西安电子科技大学 1996 一、1 (2分)】 4.已知串s=‘aaab’,其next数组值为( )。【西安电子科技大学 1996 一、7 (2分)】 a.0123 b.1123 c.1231 d.1211 5.串 ‘ababaaababaa’ 的next数组为( )。【中山大学 1999 一、7】 a.012345678999 b.012121111212 c.011234223456 d.0123012322345 6.字符串‘ababaabab’ 的nextval 为( ) a.(0,1,0,1,04,1,0,1) b.(0,1,0,1,0,2,1,0,1) c.(0,1,0,1,0,0,0,1,1) d.(0,1,0,1,0,1,0,1,1 ) 【北京邮电大学 1999 一、1(2分)】 7.模式串t=‘abcaabbcabcaabdab’,该模式串的next数组的值为( ),nextval数组的值为 ( )。 a.0 1 1 1 2 2 1 1 1 2 3 4 5 6 7 1 2 b.0 1 1 1 2 1 2 1 1 2 3 4 5 6 1 1 2 c.0 1 1 1 0 0 1 3 1 0 1 1 0 0 7 0 1 d.0 1 1 1 2 2 3 1 1 2 3 4 5 6 7 1 2 e.0 1 1 0 0 1 1 1 0 1 1 0 0 1 7 0 1 f.0 1 1 0 2 1 3 1 0 1 1 0 2 1 7 0 1 【北京邮电大学 1998 二、3 (2分)】 8.若串s=’software’,其子串的数目是( )。【西安电子科技大学 2001应用 一、2(2分)】 a.8 b.37 c.36 d.9 9.设s为一个长度为n的字符串,其中的字符各不相同,则s中的互异的非平凡子串(非空且不同于s本身)的个数为( )。【中科院计算所 1997 】 a.2n-1 b.n2 c.(n2/2)+(n/2) d.(n2/2)+(n/2)-1 e. (n2/2)-(n/2)-1 f.其他情况 10.串的长度是指( )【北京工商大学 2001 一、6 (3分)】 a.串中所含不同字母的个数 b.串中所含字符的个数 c.串中所含不同字符的个数 d.串中所含非空格字符的个数
二、判断题 1.kmp算法的特点是在模式匹配时指示主串的指针不会变小。( )【北京邮电大学 2002 一、4 (1分)】 2.设模式串的长度为m,目标串的长度为n,当n≈m且处理只匹配一次的模式时,朴素的匹配(即子串定位函数)算法所花的时间代价可能会更为节省。( )【长沙铁道学院 1998 一、1 (1分)】 3.串是一种数据对象和操作都特殊的线性表。( )【大连海事大学 2001 1、l (1分)】
三、填空题 1.空格串是指__(1)__,其长度等于___(2)__。 【西安电子科技大学 2001软件 一、4(2分)】 2.组成串的数据元素只能是________。 【中山大学 1998 一、5 (1分)】 3.一个字符串中________称为该串的子串 。 【华中理工大学 2000 一、3(1分)】 4.index(‘datastructure’, ‘str’)=________。【福州大学 1998 二、4 (2分)】 5.设正文串长度为n,模式串长度为m,则串匹配的kmp算法的时间复杂度为________。 【重庆大学 2000 一、4】 6.模式串p=‘abaabcac’的next函数值序列为________。【西安电子科技大学 2001软件 一、6(2分)】 7.字符串’ababaaab’的nextval函数值为________。 【北京邮电大学 2001 二、4 (2分)】 8.设t和p是两个给定的串,在t中寻找等于p的子串的过程称为__(1)__,又称p为__(2)__。 【西安电子科技大学 1998 二、5 (16/6分)】 9.串是一种特殊的线性表,其特殊性表现在__(1)__;串的两种最基本的存储方式是__(2)__、__(3)__;两个串相等的充分必要条件是__(4)__。 【中国矿业大学 2000 一、3 (4分)】 10.两个字符串相等的充分必要条件是_______。 【西安电子科技大学 1999软件 一、1 (2分)】 11.知u=‘xyxyxyxxyxy’;t=‘xxy’; assign(s,u); assign(v,substr(s,index(s,t),len(t)+1)); assign(m,‘ww’) 求replace(s,v,m)= ________。 【东北大学 1997 一、1 (5分)】 12.实现字符串拷贝的函数 strcpy为: void strcpy(char *s , char *t) /*copy t to s*/ { while (________) } 【浙江大学 1999 一、5 (3分)】 13.下列程序判断字符串s 是否对称,对称则返回1,否则返回0;如 f('abba')返回1,f('abab')返回0; int f((1)________) {int i=0,j=0; while (s[j])(2)________; for(j--; i<j && s[i]==s[j]; i++,j--); return((3)_______) } 【浙江大学 1999 一、6 (3分)】 14.下列算法实现求采用顺序结构存储的串s和串t的一个最长公共子串。 程序(a) procedure maxcomstr(var s,t : orderstring; var index,length : integer); var i,j,k,length1:integer; con:boolean; begin index :=0; length :=0; i :=1; while(i<=s.len) do [j:=1; while (j<=t.len) do [ if (s[i]=t[j]) then [ k:=1; length1:=1; con:=true; while con do if (1)__then [length1:=length1+1;k:=k+1;] else(2) _; if (length1>length) then [index:=i; length:=length1; ] (3)____; ] else (4)____; ] (5) ___; ] end; 程序(b) void maxcomstr(orderstring *s,*t; int index, length) {int i,j,k,length1,con; index=0;length=0;i=1; while (i<=s.len) {j=1; while(j<=t.len) { if (s[i]= =t[j]) { k=1;length1=1;con=1; while(con) if (1) _ { length1=length1+1;k=k+1; } else (2) __; if (length1>length) { index=i; length=length1; } (3)____; } else (4) ___; } (5) __ } } 【上海大学 2000 一、2 (10分)】 15.完善算法:求kmp算法中next数组。 proc get _next(t:string,var next:array[1..t.len] of integer); begin j:=1; k:=(1)__; next[1]:=0; while j<t.len do if k=0 or t.ch[j]=t.ch[k] then begin j:=j+1; k:=k+1; next[j]:=k;end else k:=(2)___; end; 【中山大学 1998 四、1 (4分)】 16.下面函数index用于求t是否为s的子串,若是返回t第一次出现在s中的序号(从1开始计),否则返回0。 例如:s=‘abcdefcdek’,t=‘cde’,则indse(s,t)=3, index(s,’aaa’)=0 。已知t,s的串长分别是mt,ms func index(s,t,ms,mt); i:=1;j:=1; while (i<ms) and (j<mt) do if s[i]=t[j] then [ (1)__; (2)__] else [ (3)___; (4)_ ] if j>mt then return (5)____; else return (6)__ endf; 【南京理工大学 1999 三、2 (6分)】 17.阅读下列程序说明和pascal程序,把应填入其中的( )处的字句写在答题纸上。 程序说明: 本程序用于判别输入的字符串是否为如下形式的字符串: w&m$ 其中,子字符串m是子字符串w的字符反向排列,在此假定w不含有字符&和字符$,字符&用作w与m的分隔符,字符$用作字符串的输入结束符。 例如,对输入字符串ab&ba$、11&12$、ab&dd$、&$,程序将分别输出ok.(是),no.(不是)。 程序 program accept(input,output); const midch=’&’; endch=’$’; var an:boolean; ch:char; procedure match(var answer: boolean); var ch1,ch2:char; f:boolean; begin read(ch1); if ch1<>endch then if (1)__ then begin match(f); if f then begin read(ch2); answer:=(2)_ end else answer:=false end else (3)___ else (4)___ end; begin writeln(‘enter string:’); match(an); if an then begin (5)__ if (6)_ then writeln(‘ok.’) else writeln(‘no.’) end else writeln(‘no.’) end. 【上海海运学院 1998 七 (15分)】 18.试利用下列栈和串的基本操作完成下述填空题。 initstack(s) 置s为空栈; push(s,x) 元素x入栈; pop(s) 出栈操作; gettop(s) 返回栈顶元素; sempty(s) 判栈空函数; setnull(st) 置串st为空串; length(st) 返回串st的长度; equal(s1,s2) 判串s1和s2是否相等的函数; concat(s1,s2) 返回联接s1和s2之后的串; sub(s,i,1) 返回s中第i个字符; empty(st) 判串空函数 func invert(pre:string; var exp:string):boolean; {若给定的表达式的前缀式pre正确,本过程求得和它相应的表达式exp并返回“true”,否则exp为空串,并返回“false”。已知原表达式中不包含括弧,opset为运算符的集合。} var s:stack; i,n:integer; succ:boolean; ch: char; begin i:=1; n:=length(pre); succ:=true; (1)__; (2)__; while (i<n) and succ do begin ch:=sub(pre,i,l); if (3)_ then (4)__ else if (5)__then (6)_ else begin exp:=concat((7)___,(8)____); exp:=concat((9)___,(10)___); (11)__; end; i:=i+1 end; if (12)___then begin exp:=concat(exp,sub(pre,n,1)); invert:=true end else begin setnull(exp); invert:=false end end; 注意:每个空格只填一个语句。 【清华大学 1996 八】
四、应用题 1.名词解释:串 【大连海事 1996 一、10 (1分) 】【河海大学 1998 二、5(3分)】 2.描述以下概念的区别:空格串与空串。【大连海事大学 1996 三、2、(1) (2分)】 3.两个字符串s1和s2的长度分别为m和n。求这两个字符串最大共同子串算法的时间复杂度为t(m,n)。估算最优的t(m,n),并简要说明理由。 【北京工业大学 1996 一、5 (6分)】 4.设主串s=‘xxyxxxyxxxxyxyx’,模式串t=‘xxyxy’。请问:如何用最少的比较次数找到t在s中出现的位置?相应的比较次数是多少? 【大连海事大学 2001 四 (8分)】 5.kmp算法(字符串匹配算法)较brute(朴素的字符串匹配)算法有哪些改进?【大连海事大学1996三、1((2分)】 6.已知模式串t=‘abcaabbabcab’写出用kmp法求得的每个字符对应的next和nextval函数值。 【北京邮电大学 1997 三 (10分)】 7.给出字符串‘abacabaaad’在kmp算法中的next和nextval数组。【北京邮电大学 2000 三、1(5分)】 8.令t=‘abcabaa’,求其next 函数值和nextval函数值。 【北方交通大学 1994 一 (6分)】 9.已知字符串‘cddcdececdea’,计算每个字符的next和nextval函数的值。【南京邮电大学 2000 一 2】 10.试利用kmp算法和改进算法分别求p1=‘abaabaa’和p2=‘aabbaab’的next函数和nextval函数。 【东南大学 1999 一、6(8分)】 11.已知kmp串匹配算法中子串为babababaa,写出next数组改进后的next数组信息值(要求写出数组下标起点)。【西南交通大学 2000 二、2】 12.求模式串t=‘abcaabbac' 的失败函数next(j)值。【西安交通大学 1996 四、4 (5分)】 13.字符串的模式匹配kmp算法中,失败函数(next)是如何定义的?计算模式串p=‘aabaabaaabc’中各字符的失败函数值.【石油大学 1998 一、2 (10分)】 14.设字符串s=‘aabaabaabaac',p=‘aabaac' (1)给出s和p的next值和nextval值; (2)若s作主串,p作模式串,试给出利用bf算法和kmp算法的匹配过程。 【北方交通大学1998二(15分)】 15.设目标为t=‘abcaabbabcabaacbacba’,模式为p=‘abcabaa’ (1)计算模式p的naxtval函数值;(5分) (2)不写出算法,只画出利用kmp算法进行模式匹配时每一趟的匹配过程。(5分) 【清华大学 1998 八(10分)】 16.模式匹配算法是在主串中快速寻找模式的一种有效的方法,如果设主串的长度为m,模式的长度为n,则在主串中寻找模式的kmp算法的时间复杂性是多少?如果,某一模式 p=’abcaacabaca’,请给出它的next函数值及next函数的修正值nextval之值。【上海交通大学 2000 一 (5分)】 17.设目标为s=‘abcaabbcaaabababaabca’,模式为p=‘babab’, (1)手工计算模式p的nextval数组的值;(5分) (2)写出利用求得的nextval数组,按kmp算法对目标s进行模式匹配的过程。 (5分) 【清华大学 1997 四(10分)】 18.用无回溯的模式匹配法(kmp法)及快速的无回溯的模式匹配法求模式串t的next[j]值,添入下面表中: j 1 2 3 4 5 6 7 t a a b b a a b kmp法求得的next[j]值 快速无回溯法求得的next[j]值 【北京邮电大学 1992 三、1(25/4分)】 19.在改进了的(无回溯)字符串模式匹配中,要先求next数组的值。下面是求nextval值的算法。 type sar=array[1..m] of integer; pty=array[1..m] of char; procedure next2(p:pty;var nextval:sar); {在模式p中求nextval数组的值} 1 begin 2 j:=1;nextval[1]:=0;k:=0 3 repeat 4 if (k=0) or (p[j]=p[k]) 5 then [ j:=j+1;k:=k+1; 6 if p[j]=p[k] 7 then nextval[j]:=nextval[k] 8 else nextval[j]:=k ] 9 else k:=nextval[k] 10 until j=m 11 end; 算法中第4行有p[j]=p[k],第六行中也有p[j]=p[k]。两处比较语句相同。请分析说明此两处比较语句的含义是什么?分析此算法在最坏情况下的时间复杂度是多少?【北京邮电大学 1993 二、2(6分)】 20.在字符串模式匹配的kmp算法中,求模式的next数组值的定义如下: next[j]= 请问: (1)当j=1时,为什么要取next[1]=0? (2)为什么要取max{k},k最大是多少? (3)其它情况是什么情况,为什么取next[j]=1? 【北京邮电大学 1994 二(8分)】 21.给出kmp算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么? 【东南大学 1993 一、3 (9分) 1997 一、2 (8分) 2001 一、6 (6分)】 22. 在模试匹配kmp算法中所用失败函数f的定义中,为何要求p1p2……pf(j)为p1p2……pj两头匹配的真子串?且为最大真子串? 【东南大学 1996 一、3(7分)】 23.如果两个串含有相等的字符,能否说它们相等?【西安电子科技大学 2000软件 一、3 (5分)】 24.设s1,s2为串,请给出使s1//s2=s2//s1成立的所有可能的条件(//为连接符)。 【长沙铁道学院 1997 三、5 (3分)】【国防科技大学 1999 一 】 25.已知:s ='(xyz)+*',t ='(x+z)*y'。试利用联结、求子串和置换等基本运算,将 s 转化为 t 。 【北方交通大学 1996 一、3(5分)】【山东科技大学 2002 一、6 (5分)】
第五部分、算法设计 1.设s、t为两个字符串,分别放在两个一维数组中,m、n分别为其长度,判断t是否为s的子串。如果是,输出子串所在位置(第一个字符),否则输出0。(注:用程序实现)【南京航空航天大学 1997 九(10分)】 2.输入一个字符串,内有数字和非数字字符,如:ak123x456 17960?302gef4563,将其中连续的数字作为一个整体,依次存放到一数组a中,例如123放入a[0],456放入a[1],… … 。编程统计其共有多少个整数,并输出这些数。【上海大学 1998 一 (13分)】 3. 以顺序存储结构表示串,设计算法。求串s中出现的第一个最长重复子串及其位置并分析算法的时间复杂度。【东南大学 2000 五 (15分)】 类似本题的另外叙述有: (1)如果字符串的一个子串(其长度大于1)的各个字符均相同,则称之为等值子串。试设计一算法,输入字符串s,以“!”作为结束标志。如果串s中不存在等值子串,则输出信息“无等值子串”,否则求出(输出)一个长度最大的等值子串。 例如:若s=“abc123abc123!”,则输出“无等值子串”;若s=“abceebccadddddaaadd!”,则输出“ddddd”。 【华中科技大学 2001】 10.编写程序,统计在输入字符串中各个不同字符出现的频度并将结果存入文件(字符串中的合法字符为a-z这26个字母和0-9这10个数字)。【西北大学 2000 四 (10分)】 11.写一个递归算法来实现字符串逆序存储,要求不另设串存储空间。 【西南交通大学 2000 三、2】 12.已知三个字符串分别为s=’ab…abcaabcbca…a’,s’=’caab’, s’’=’bcb’。利用所学字符串基本运算的函数得到结果串为:s’’’=’caabcbca…aca…a’,要求写出得到上结果串s’’’所用的函数及执行算法。【东北大学 1998 一、1 (10分)】 13.s=“s1s2…sn”是一个长为n的字符串,存放在一个数组中,编程序将s改造之后输出: (1)将s的所有第偶数个字符按照其原来的下标从大到小的次序放在s的后半部分; (2)将s的所有第奇数个字符按照其原来的下标从小到大的次序放在s的前半部分; 例如: s=‘abcdefghijkl’ 则改造后的s为‘acegikljhfdb’。【中科院计算所 1995】
|