Define and implement P_copy, a read-and-write based copy method (rather than
[dyninst.git] / common / src / linuxKludges.C
1 /*
2  * Copyright (c) 1996-2004 Barton P. Miller
3  * 
4  * We provide the Paradyn Parallel Performance Tools (below
5  * described as "Paradyn") on an AS IS basis, and do not warrant its
6  * validity or performance.  We reserve the right to update, modify,
7  * or discontinue this software at any time.  We shall have no
8  * obligation to supply such updates or modifications or any other
9  * form of support to you.
10  * 
11  * This license is for research uses.  For such uses, there is no
12  * charge. We define "research use" to mean you may freely use it
13  * inside your organization for whatever purposes you see fit. But you
14  * may not re-distribute Paradyn or parts of Paradyn, in any form
15  * source or binary (including derivatives), electronic or otherwise,
16  * to any other organization or entity without our permission.
17  * 
18  * (for other uses, please contact us at paradyn@cs.wisc.edu)
19  * 
20  * All warranties, including without limitation, any warranty of
21  * merchantability or fitness for a particular purpose, are hereby
22  * excluded.
23  * 
24  * By your use of Paradyn, you understand and agree that we (or any
25  * other person or entity with proprietary rights in Paradyn) are
26  * under no obligation to provide either maintenance services,
27  * update services, notices of latent defects, or correction of
28  * defects for Paradyn.
29  * 
30  * Even if advised of the possibility of such damages, under no
31  * circumstances shall we (or any other person or entity with
32  * proprietary rights in the software licensed hereunder) be liable
33  * to you or any third party for direct, indirect, or consequential
34  * damages of any character regardless of type of action, including,
35  * without limitation, loss of profits, loss of use, loss of good
36  * will, or computer failure or malfunction.  You agree to indemnify
37  * us (and any other person or entity with proprietary rights in the
38  * software licensed hereunder) for any and all liability it may
39  * incur to third parties resulting from your use of Paradyn.
40  */
41
42 #include "common/h/headers.h"
43
44 typedef int (*intKludge)();
45
46 int P_getopt(int argc, char *argv[], const char *optstring)
47 {
48   /* On linux we prepend a + character */
49   char newopt[strlen(optstring)+5];
50   strcpy(newopt, "+");
51   strcat(newopt, optstring);
52   return getopt(argc, argv, newopt);
53 }
54
55 int P_copy(const char *from, const char *to) {
56     int from_fd = P_open(from, O_RDONLY, 0);
57     if (from_fd == -1)  {
58         perror("Opening from file in copy"); 
59         return -1;
60     }
61     int to_fd = P_open(to, O_WRONLY | O_APPEND | O_CREAT | O_TRUNC, 0);
62     if (to_fd == -1) {
63         perror("Opening to file in copy");
64         close(from_fd);
65         return -1;
66     }
67
68     char buffer[1048576];
69     while(true) {
70         int amount = read(from_fd, buffer, 1048576);
71         if (amount == -1) {
72             perror("Reading in file copy");
73             return -1;
74         }
75         write(to_fd, buffer, amount);
76         if (amount < 1048576) break;
77     }
78     close(to_fd);
79     close(from_fd);
80     return 0;
81 }
82
83
84 unsigned long long PDYN_div1000(unsigned long long in) {
85    /* Divides by 1000 without an integer division instruction or library call, both of
86     * which are slow.
87     * We do only shifts, adds, and subtracts.
88     *
89     * We divide by 1000 in this way:
90     * multiply by 1/1000, or multiply by (1/1000)*2^30 and then right-shift by 30.
91     * So what is 1/1000 * 2^30?
92     * It is 1,073,742.   (actually this is rounded)
93     * So we can multiply by 1,073,742 and then right-shift by 30 (neat, eh?)
94     *
95     * Now for multiplying by 1,073,742...
96     * 1,073,742 = (1,048,576 + 16384 + 8192 + 512 + 64 + 8 + 4 + 2)
97     * or, slightly optimized:
98     * = (1,048,576 + 16384 + 8192 + 512 + 64 + 16 - 2)
99     * for a total of 8 shifts and 6 add/subs, or 14 operations.
100     *
101     */
102
103    unsigned long long temp = in << 20; // multiply by 1,048,576
104       // beware of overflow; left shift by 20 is quite a lot.
105       // If you know that the input fits in 32 bits (4 billion) then
106       // no problem.  But if it's much bigger then start worrying...
107
108    temp += in << 14; // 16384
109    temp += in << 13; // 8192
110    temp += in << 9;  // 512
111    temp += in << 6;  // 64
112    temp += in << 4;  // 16
113    temp -= in >> 2;  // 2
114
115    return (temp >> 30); // divide by 2^30
116 }
117
118 unsigned long long PDYN_divMillion(unsigned long long in) {
119    /* Divides by 1,000,000 without an integer division instruction or library call,
120     * both of which are slow.
121     * We do only shifts, adds, and subtracts.
122     *
123     * We divide by 1,000,000 in this way:
124     * multiply by 1/1,000,000, or multiply by (1/1,000,000)*2^30 and then right-shift
125     * by 30.  So what is 1/1,000,000 * 2^30?
126     * It is 1,074.   (actually this is rounded)
127     * So we can multiply by 1,074 and then right-shift by 30 (neat, eh?)
128     *
129     * Now for multiplying by 1,074
130     * 1,074 = (1024 + 32 + 16 + 2)
131     * for a total of 4 shifts and 4 add/subs, or 8 operations.
132     *
133     * Note: compare with div1000 -- it's cheaper to divide by a million than
134     *       by a thousand (!)
135     *
136     */
137
138    unsigned long long temp = in << 10; // multiply by 1024
139       // beware of overflow...if the input arg uses more than 52 bits
140       // than start worrying about whether (in << 10) plus the smaller additions
141       // we're gonna do next will fit in 64...
142
143    temp += in << 5; // 32
144    temp += in << 4; // 16
145    temp += in << 1; // 2
146
147    return (temp >> 30); // divide by 2^30
148 }
149
150 unsigned long long PDYN_mulMillion(unsigned long long in) {
151    unsigned long long result = in;
152
153    /* multiply by 125 by multiplying by 128 and subtracting 3x */
154    result = (result << 7) - result - result - result;
155
156    /* multiply by 125 again, for a total of 15625x */
157    result = (result << 7) - result - result - result;
158
159    /* multiply by 64, for a total of 1,000,000x */
160    result <<= 6;
161
162    /* cost was: 3 shifts and 6 subtracts
163     * cost of calling mul1000(mul1000()) would be: 6 shifts and 4 subtracts
164     *
165     * Another algorithm is to multiply by 2^6 and then 5^6.
166     * The former is super-cheap (one shift); the latter is more expensive.
167     * 5^6 = 15625 = 16384 - 512 - 256 + 8 + 1
168     * so multiplying by 5^6 means 4 shift operations and 4 add/sub ops
169     * so multiplying by 1000000 means 5 shift operations and 4 add/sub ops.
170     * That may or may not be cheaper than what we're doing (3 shifts; 6 subtracts);
171     * I'm not sure.  --ari
172     */
173
174    return result;
175 }